A deliciosa árdua tarefa da análise de dados das eleições municipais para o data_labe

polinho
data_labe
Published in
4 min readJan 12, 2021

“Para calcular o índice de elegibilidade, você divide a quantidade de eleitos pela quantidade de votos recebidos”. Foi assim que Juliana Marques — amiga e estatística do Mulheres Negras Decidem — me respondeu enquanto caminhávamos para almoçar no Bar da Amparo na Maré. Eu estava contando sobre o convite feito pelo Alma Preta para um especial sobre as eleições municipais que se aproximavam e a questionei sobre o índice de elegibilidade que ela havia usado em análises passadas.

Confesso que a ideia de um índice de elegibilidade não satisfez a minha curiosidade. Eu estava pensando sobre representatividade, sobre justiça e capacidade de mudança nos pleitos municipais. Na minha cabeça o tal índice fazia sentido matematicamente e se aproximava do conceito de probabilidade, que calcula a razão entre os eventos acontecidos sobre todos do cenário ocorrido. Mas essa ideia não me conquistou!

Será que dava pra fazer algo um pouco diferente do que os outros já fizeram? Talvez se a gente tivesse os dados populacionais da cidade e cruzasse com os dados eleitorais poderíamos chegar em algum lugar diferente. Não por sorte, eu faço parte de uma equipe muito capaz, e então eu me dei conta que tinha 6 mãos, 6 braços e 3 grandes cérebros para compor índices de representatividade de candidaturas, de eleitas e eleitos e de investimento nas campanhas.

  • “Estephany o que você acha de ir nas bases do IBGE e trazer a quantidade em números absolutos e percentuais sobre sexo, raça e escolaridade para todas as cidades do Brasil? E em quanto tempo você consegue isso?”
  • “Samantha, o que você acha de ir nas bases do TSE e trazer a quantidade em números absolutos e percentuais sobre sexo, raça e escolaridade para todes es candidates das cidades do Brasil? E em quanto tempo você consegue isso?”

A gente não sabia em quanto tempo conseguiríamos, mas eu tinha a certeza que nos ajudaríamos até chegar no local que eu passei a rabiscar no quadro branco dentro do galpinho do data_labe na Maré. Começou assim:

“Vê se faz sentido pra vocês: se eu pegar a porcentagem de candidates negres num pleito e dividir pela porcentagem de pessoas negras numa cidade e o resultado der igual a 1 (um), então essa cidade esteve bem representada em candidaturas.

Se eu posso fazer isso pra candidates, dá pra fazer pra eleites também. Porque se em uma câmara municipal de vereadores eu tiver 15% de pessoas negras eleitas e essa cidade também tem 15% de habitantes negres, quando eu dividir esses dois números ele vai dar 1 (um) o que seria uma representatividade de 100%, né?”

Pronto, é simples. Porém falar algo de forma simples é bem difícil. Depois conversamos se deveríamos fazer uma regressão linear, ou uma análise de variância de um ou dois fatores. Talvez apresentar de forma categorizada? Foi bem representada ou não foi? Ou melhor apresentar de forma contínua? O quanto cada município foi bem representado?

Fizemos TUDO!

Os números absolutos, as porcentagens, categorizamos em sim e não e, estendemos o mesmo conceito para o dinheiro declarado envolvido nas candidaturas.

Somamos todos os recursos declarados pelas campanhas, e agrupamos pela raça/cor, e se no pleito do município ele teve 20% de candidatos negros, o dinheiro declarado teria que ser de 20% pelos candidates negres.

Foram três semanas trabalhando muito. A gente viu que não conseguiria fazer para o Brasil todo, mas me consolei prometendo que no próximo pleito a gente se organizaria melhor e faria nacionalmente. Escolhemos os estados do Rio de Janeiro, São Paulo e Bahia e prometemos três produtos:

  • Os índices de representatividade de candidaturas, de eleites, e de investimento justo.
  • As análises comparativas entre os partidos de direita/centro/esquerda para us candidates, para os/as eleites, tudo comparando por sexo, raça e escolaridade.
  • As análises da quantidade de mulheres pretas com ensino superior candidatas e eleitas.

Mas só faria sentido se fizéssemos para CADA CIDADE, afinal as eleições eram municipais. Rio de Janeiro com 92 municípios e São Paulo e Salvador com mais ou menos 400 cidades cada uma. CÁ CÁ CÁ CÁ!

E a gente entregou!

Depois tínhamos que entender tudo o que significava. Foram muitas reuniões explicando para a equipe de jornalismo o que representava cada coisa, alguns gráficos lindos de correlação e regressões lineares falhamos em explicar, e editorialmente não foram escolhidos para as reportagens. Uma grande frustração para nossa equipe de dados. :/

Tínhamos feito análises comparando negros e pretos, comprovamos gradientes de associação e muito, muito do nosso trabalho foi deixado de fora. Plotamos mapas de calor, que demonstravam como a capital e o entorno parecem ser mais racistas na hora do voto. Eles também não foram usados.

Leia as reportagens completas em datalabe.org

Talvez você que esteja lendo esse relato e leu as reportagens esteja pensando que tudo bem, as reportagens ficaram ótimas. Mas talvez você não esteja levando em consideração o tempo que a gente leva construindo cada linha de comando, a estruturação do dado, escolhendo o melhor mapa, vendo e revendo porque deu errado. Fiquei frustrado no processo, bastante até. Eu com certeza preciso explicar melhor análises mais complexas e pensar em formas de comunicar para o nosso público. Abandonar análises mais complexas não é meu objetivo, eu realmente não acho que o grande público não vai conseguir entender.

Atualmente estou insistindo em mostrarmos um gráfico em escala logarítmica, porque ele comprova a relação que estamos trabalhando (será um próximo texto? risos). Acho que os conhecimentos matemáticos ajudam a entendermos melhor nossa realidade. Foi bonito ver como matematicamente contamos uma história para todo mundo ouvir e ler.

A política está diferente, não como queríamos, e muito se deve às muitas análises de dados que denunciam como nossa realidade não nos satisfaz e por isso devemos mudar. Não é o melhor trabalho e nem é único, antes de mim teve muita gente analisando dados eleitorais, mas foi um bom trabalho. E ter participado de tudo isso foi muito bom. Thank you. Next!

--

--

polinho
data_labe
Writer for

Coordenador de dados do data_labe. Epidemiologista formado pelo IESC/UFRJ - Doutorando em saúde pública.