O depoimento do ex-juiz Sérgio Moro movimentou o Twitter

A #VazaJato no Twitter: Animação da dinâmica das Hashtags no Twitter durante depoimento de Sérgio Moro no Senado

Nos capítulos anteriores…

Em 09 de Junho de 2019, o Intercept Brasil divulgou as primeiras de uma série de reportagens contendo conversas no mínimo inadequadas entre o ex-juiz Sérgio Moro e Procuradores da Lava Jato . De lá para cá, não se fala em outra coisa nas redes sociais do Brasil, em especial no Twitter. Para tentar entender melhor as reações da sociedade às polêmicas envolvendo tão importantes personagens da história recente do Brasil, resolvemos usar ciência de dados e, em especial, a linguagem de programação R para analisar as reações do Twitter à chamada Operação #VazaJato.

Novo capítulo…

Em 19 de Junho de 2019, o ex-juiz Sérgio Moro prestou depoimento no Senado Federal sobre a polêmica envolvendo as conversas reveladas pelo The Intercept Brasil. Neste post, apresentamos uma animação que mostra como se comportaram as principais hashtags associadas à palavra “Moro” ao longo daquele dia.

Hashtags animadas

Para criar um animated bar chart de hashtags a partir de dados extraídos via API do Twitter, a primeira coisa que fizemos foi acumular os dados a cada 15 minutos com o objetivo de obter volume de dados suficiente para ranquear as hashtags mais usadas. Para cada intervalo de 15 minutos contabilizamos quantas vezes apareciam hashtags. Esse trabalho é facilitado porque os dados baixados via API classificam automaticamente as hashtags de cada tuíte. Com esses dados já é possível desenhar um gráfico de barras em que o eixo vertical representa as hashtags identificadas e o eixo horizontal representa quantas vezes cada hashtag foi contabilizada. Usamos então a biblioteca gganimate, da linguagem de programação R, para realizar transições desse gráfico de barras para cada intervalo de 15 minutos. Com comandos simples essa biblioteca se encarrega de desenhar o gráfico de barras para cada passo de tempo e juntar os gráficos de todos os passos de tempo em uma animação em formato GIF ou MP4. O resultado dessa análise é a animação mostrada na figura 1.

Figure 1. Animação contendo volume de citações de hashtags relacionadas ao termo “Moro” ao longo do dia do depoimento do ex-juiz Sérgio Moro ao Senado

Um pouco de pimenta…

O fenômeno típico dos estudos sub-atômicos que ocorre nas menções a #detonatudomoro é impressionante. Sai de 1781 ocorrências para 2225 em 15 minutos. Isso faz com que a hashtag realize um salto quântico de algumas camadas na corrida das barras. Ressalta-se ainda que a aceleração que se segue é comparável à dos artefatos espaciais das séries de ficção científica. Isso tudo reforça a hipótese de uso de robôs. Aguarde que esse pode ser o próximo capítulo da nossa série.


Dadoscope

Cientistas de dados que usam dados abertos, dashboards, machine learning e um pouco de criatividade para entender o mundo à nossa volta

Charles Novaes de Santana

Written by

Data Scientist — passionate by fractals, networks, animations, and my family

Dadoscope

Dadoscope

Cientistas de dados que usam dados abertos, dashboards, machine learning e um pouco de criatividade para entender o mundo à nossa volta