1 Mês desde que as primeiras reportagens da #VazaJato foram divulgadas

O primeiro mês da #VazaJato no Twitter

Charles Novaes de Santana
Dadoscope
6 min readJul 21, 2019

--

No último dia 09 de Julho, completou-se um mês desde que a primeira reportagem do Intercept Brasil divulgou diálogos comprometedores entre os procuradores da república e o ex-juiz Sérgio Moro a respeito da Operação Lava Jato. Os desdobramentos daquela primeira reportagem envolvem a divulgação de novas conversas por outros veículos de comunicação como a Folha, a Veja e o programa do jornalista Reinaldo Azevêdo. As reportagens também resultaram na convocação do ex-juiz Sérgio Moro e do jornalista Glenn Greenwald, os dois principais atores dessa trama jornalística, para esclarecimentos no Senado e na Câmara dos deputados. Desde então, ocorreram manifestações críticas e em apoio ao então Ministro da Justiça. Para cada um destes atos, a repercussão nas redes sociais foi imediata e massiva. Desde o dia 09 de Junho, o twitter brasileiro foi dominado pela hashtag #VazaJato e suas acompanhantes: #MoroCriminoso, #DetonaTudoMoro, #Dia30NasRuas. Neste post, nós tentamos entender como os eventos associados à #VazaJato no mundo real se relacionam com a dinâmica dos usuários do Twitter neste período. Para isto, utilizaremos um pouco de criatividade e métodos de visualização de dados.

Entre os dias 09 de Junho e 08 de Julho de 2019, nós baixamos os tuítes relacionados aos principais atores da #VazaJato. Utilizamos termos de busca como “Moro”, “#VazaJato”, “Lula”, “Dallagnol”, “Intercept”. O volume de citações desses termos é impressionante. Apenas entre os tuítes contendo o termo “Moro”, foram baixadas mais de 6 Milhões e 800 Mil mensagens. Como uma das linguagens mais fortes das redes sociais atualmente é a linguagem das hashtags, dedicamos um maior esforço a entender apenas as mensagens que continham alguma hashtag associada. Entendemos que as hashtags são fundamentais para a disseminação de informações no Twitter pois organizam a discussão em tópicos permitindo a observação de grupos de usuários que querem falar sobre um mesmo assunto.

Conseqüentemente, nós filtramos as mensagens que, além de conterem o termo “Moro”, também continham pelo menos uma hashtag. Isto resultou em uma base de dados bem menor, mas ainda impressionante, de “apenas” 874 Mil mensagens. As análises abaixo se referem a essa base de dados. Todos os códigos e dados utilizados neste post encontram-se livremente disponíveis na internet aqui e aqui.

Figura 1: Linha do tempo das hashtags associadas a Moro

Na Figura 1 acima, representamos o número de publicações por hora contendo diferentes hashtags. No eixo vertical representamos cada uma das hashtags e no eixo horizontal do gráfico representamos os dias para os quais baixamos os tuítes. O tamanho de cada ponto no gráfico está associado ao número de publicações por hora de uma hashtag em cada dia. Percebe-se que #VazaJato, que é o motor da nossa investigação, aparece em toda a linha do tempo com exceção do dia 18/06 — dia em que não nos foi possível obter os dados do twitter. Vê-se claramente um grande volume no primeiro dia e picos subsequentes que geralmente coincidem com a publicação de novas reportagens sobre os vazamentos.

Em cada nova reportagem vão surgindo atores, assuntos e/ou expressões que inspiram o uso de hashtags tais como, por exemplo, #TontosDoMBL e #EuNãoConfioNoMoro. Observa-se que, nestes casos, as hashtags têm um ciclo de vida relativamente curto, diretamente relacionado ao tempo de repercussão dos vazamentos. Além disso, os depoimentos do ex-juiz Sérgio Moro ao Congresso Nacional propiciaram o aparecimento de hashtags com uma explosão de popularidade, porém de curta duração. Observa-se, por exemplo, a #DetonaTudoMoro, que surgiu com força e rapidamente desapareceu nos dois dias que ocorreram os tais depoimentos perante as câmaras legislativas federais. Essa hashtag já é conhecida do Dadoscope e já foi citada em nosso artigo que tratava das corridas de hashtags. O comportamento bastante agressivo levantou naquele momento a hipótese de ter havido uso de robôs, os famigerados “bots”.

Um olhar atento à Figura 1 revela que a maior parte das hashtags está com uma vida relativamente longa. Isso ocorre tanto do lado daqueles tuítes que apoiam a #VazaJato como daqueles em oposição. Alguns exemplos de hashtags persistentes são #MoroCriminoso e #MoroOrgulhoDoBrasil. Apesar disto, parece haver uma considerável perseverança e prevalência de hashtags pró Vaza Jato.

Por fim é importante destacar o que ocorre no debate sobre o principal trunfo da Lava Jato, a prisão de Lula. Há pelo menos três hashtags que entram nesta disputa. Duas delas de cargas semânticas opostas parecem ter surgido ou sido reforçadas com o desdobramento da Vaza Jato: #LulaNaCadeia e #LulaLivreUrgente. Observando-se com mais detalhe a distribuição dos pontos, parecem ser hashtags “assimetricamente opostas” já que aparecem praticamente na mesma data e apresentam volumes de popularidade bastante semelhantes. Isso indica um forte comportamento de disputa pelo protagonismo dos debates no twitter. Cada um dos lados do embate parece estar vigilante com o que o outro lado faz e rapidamente se apressa a acionar os seus mecanismos de repercussão e fortalecimento de narrativas.

A terceira hashtag relacionada à prisão de Lula já é mais tradicional, trata-se da #LulaLivre. O que se destaca é que o volume de ocorrências diárias não acompanha o desempenho da #VazaJato. Aparentemente há algum deslocamento em termos do volume de citações entre a defesa dos vazamentos — que mostram os meandros da Lava Jato — com relação à defesa de que Lula está preso injustamente. Esta constatação enfraquece a tese de que a #VazaJato seria um movimento orquestrado para a libertação de Lula. Por outro lado, também reforça a legitimidade das iniciativas do Intercept Brasil e dos outros veículos de comunicação que se associaram na divulgação dos vazamentos.

O fato dos volumes de citações de #VazaJato ser sempre bem maior do que #LulaLivre não implica dizer, por outro lado, que não esteja havendo um fortalecimento de #LulaLivre a partir da expressiva divulgação de #VazaJato. Para verificar se há ou não uma correlação entre essas duas hashtags, elaborou-se a Figura 2

Figura 2: Relacionamento entre #VazaJato e #LulaLivre (escala logarítmica)

A Figura 2 mostra o número de menções a cada uma das duas hashtag numa mesma hora. Observa-se que o aumento do número de citações da #VazaJato está acompanhada de um aumento das citações de #LulaLivre. Ou seja, ainda que o volume de de citações da #VazaJato esteja em um nível de grandeza muito superior ao de #LulaLivre, percebe-se que estas duas hashtags estão, de algum modo, associadas. Isto talvez seja um indicador de que há algum sucesso nas iniciativas dos defensores da liberdade de Lula na ampliação de públicos para essa causa, tendo como referência a argumentação propiciada pelos vazamentos de que não ocorreu um julgamento justo para o ex-presidente.

Conclusão

Durante este primeiro mês de vida, a #VazaJato fez parte das conversas de todos os brasileiros e tornou-se, sem dúvida, a expressão de um período movimentado da História do Brasil. Enquanto ainda não estão escritos os livros de história sobre os detalhes deste acontecimento, nós tentamos oferecer uma retrospectiva de como estes fatos foram debatidos e opinados através da análise de dados do Twitter. Embora tenhamos consciência da especificidade social do uso das redes sociais no Brasil, em especial do Twitter, os dados não deixam de relevar ideias significativas sobre o contexto político do país. Em breve estaremos de volta com mais análises, até lá!

Sobre os autores

Charles Novaes de Santana: Cientista da computação, mestre e doutor em mudanças climáticas, com experiência no uso de técnicas de inteligência artificial e de aprendizado estatístico para responder perguntas interdisciplinares. É co-fundador de DataSCOUT, apaixonado por fractais, redes complexas, e por identificar padrões escondidos em amontoados de dados.

Tarssio Barreto: Estudante de doutorado do Programa de Engenharia Industrial da Universidade Federal da Bahia. Dedica o seu tempo ao aprendizado de máquina com particular interesse na interpretabilidade de modelos black box e qualquer desafio que lhe tire o sono!

Fernando Barbalho — Doutor em Administração pela UnB (2014). É cientista de dados no Tesouro Nacional. Pesquisa e implementa produtos para transparência no setor público brasileiro. Usa R nos finais de semana para investigar perguntas que fogem às finanças públicas.

Tomás Barcellos — Economista formado na UFSC (2014). Trabalha no Ministério da Agricultura, Pecuária e Abastecimento desde 2015, atuando hoje como Coordenador de Inovação. É mestrando do Programa de Pós-Graduação em Estudos Latino-Americanos da UnB.

Leonardo F. Nascimento — Doutor em sociologia pelo Instituto de Estudos Sociais e Políticos — IESP/UERJ (2013). Pesquisa temas relacionados à sociologia digital e aos métodos digitais de pesquisa. Atualmente é professor do Instituto de Ciência, Tecnologia e Inovação da UFBA.

--

--

Charles Novaes de Santana
Dadoscope

Data Scientist — passionate by fractals, networks, animations, and my family