Uma análise da colaboração científica numa área da pós-graduação brasileira por meio da modelagem estatística de redes sociais usando ERGM

Ricardo Barros Sampaio
Data Net Sci
Published in
3 min readFeb 24, 2018

XXXVII Congresso da Sociedade Brasileira de Computação 2018 & VI BraSNAM — Brazilian Workshop on Social Network Analysis and Mining

Este trabalho apresenta uma aplicação de métodos estatísticos à análise de uma rede social, que provê informações estatisticamente significativas sobre aspectos que podem influenciar a colaboração científica. O universo da pesquisa foi a rede de colaboração para publicações em periódicos efetivada por pesquisadores afiliados aos programas de pós-graduação na área da Ciência da Informação no Brasil. A pesquisa demonstra uma aplicação prática de métodos e ferramentas para modelagem de grafos aleatórios da família exponencial (ERGM). Os resultados e sua análise permite explicações probabilísticas sobre o comportamento dos pesquisadores em termos de fatores de auto-organização de redes sociais, bem como devida a atributos endógenos dos pesquisadores, tais como gênero, afiliação a programas de pós-graduação, área de doutorado, tempo decorrido desde a obtenção do grau de doutor, foco de pesquisa e outros. A análise indica uma forte relação endógena dentre os participantes dos programas, por vezes independente do seu posicionamento geográfico. Uma apresentação tutorial da utilização de pacotes de análise estatística de redes sociais na plataforma R possibilita utilização do método em outras áreas.

1. Introdução

A colaboração científica tem sido objeto de estudo de autores na área da ciência de redes \cite{newman_coauthorship_2004, barabasi_evolution_2002}, que se valem das características e organização das bases científicas com grandes volumes de dados para desenvolver estudos sobre estruturas das redes e padrões de colaboração entre os objetos desse estudo, que são os pesquisadores. No entanto, a grande maioria dos estudos realizados nesse universo de colaboração científica investiga a organização macroscópica das redes, levando em consideração ou aspectos descritivos tais como grau médio, diâmetro, centralização e densidade \cite{sampaio_colaboracao_2015, fonseca_co-authorship_2016}, enquanto outros estudos consideram a auto-organização complexa ou topológica das redes, analisando fenômenos tais como percolação\cite{pan_using_2011}, relevância de laços fortes e fracos \cite{ke_tie_2014,pan_strength_2012}, ligação preferencial e estruturas de mundo pequeno \cite{kronegger_collaboration_2012}, além de leis de potência \cite{wagner_network_2005, barabasi_evolution_2002}. Poucos estudos sobre colaboração científica tem levado em consideração o que é chamado de modelagem estatística das redes sociais \cite{lusher_exponential_2013}, por meio da qual a formação dos laços de colaboração entre pesquisadores é analisada de forma probabilística levando em consideração complexas combinações de múltiplos processos sociais aninhados entre si.

A proposta deste estudo é apresentar uma aplicação da modelagem estatística de redes sociais ao universo de pesquisadores de uma área específica da ciência no Brasil, a Ciência da Informação. Para tal, são utilizados os dados estruturais das redes de colaboração, bem como os atributos individuais dos pesquisadores, disponíveis em bases de dados abertos tais como nas Plataformas Sucupira[1] e Lattes[2]. Alguns desses atributos tais como gênero, afiliação a programas de pós-graduação, área de doutorado, tempo decorrido desde a obtenção do grau de doutor, foco de pesquisa e outros.

Os objetivos do presente estudo são três: (1) identificar que aprofundamentos analíticos podem ser obtidos por meio da modelagem estatística de redes utilizando modelos da família de grafos aleatórios exponenciais; (2) apresentar de forma tutorial um guia que facilite o acesso de pesquisadores interessados no desenvolvimento de modelos estatísticos de redes sociais; (3) apresentar as características das redes de colaboração numa área da ciência brasileira, a Ciência da Informação, a fim de identificar o potencial de aplicabilidade sistemática dos métodos de modelagem estatística de redes, na avaliação e aprimoramento de políticas de pesquisa científica no Brasil.

[1] https://sucupira.capes.gov.br/sucupira/

[2] http://lattes.cnpq.br/

--

--