Como Mentir Com Estatística

Quando números que parecem tão fortes são na realidade frágeis

Ao verificar um levantamento estatístico, podemos ter consciência de erros presentes numa pesquisa por amostragem, cálculo de média, manipulação intencional ou não de gráficos, bem como em erros de lógica que se referem a causa e efeito, além de outros. Eu não sou profissional de estatística, por isso nossa leitura terá uma pequena ajuda do livro de Darrell Huff, com o mesmo nome desse texto, chamado Como Mentir Com Estatística (1954). Embora seja antigo, esse pequeno manual prático é útil ainda nos dias de hoje, em especial para nós cidadãos consumidores do trabalho alheio. Vamos ver onde residem alguns pequenos deslizes.

A Amostra Tendenciosa

A primeira fase da coleta de dados é a definição da amostra. Uma vez que você quer extrair informação de certa parte da população, a representação dela precisa ser derivada da amostra com o número mais abrangente de representantes possível; é preciso garantir que não existem restrições.

Se você vai às ruas, exclui aqueles que estão em casa comumente naquele horário. Se pesquisa durante o dia, ignora a maioria empregada que está ocupada a maior parte do tempo. Se vai à noite, esquece as que saem para o cinema ou boate. A batalha contra a tendenciosidade é travada o tempo todo, uma batalha que nunca é de fato vencida. Se lhe for dito que “67% dos americanos são contra ou a favor de algo” a pergunta surge: 67% de quais americanos?

E podemos ressaltar outra curiosidade: se você fizesse uma pesquisa de opinião política hoje no Brasil, seria uma surpresa se alguém respondesse o que na verdade fosse mais conveniente, ao invés de dizer o que ela realmente pensava (se defendesse o nazismo, por exemplo)?

O que os Numerosinhos Representam

Resultados coletados eventualmente podem não significar nada, ao mero acaso. Um ótimo exemplo disso é jogando cara ou coroa.

A probabilidade de cair coroa ou cara, como todos sabem, é de 50%. Bem… se eu jogar a moeda agora 10 vezes, de modo que 8 delas deem cara, eu posso interpretar esse levantamento como a prova de que cara é dada em 80% das vezes. Ou seja, eu tenho a liberdade de dizer em uma pesquisa ou um noticiário genérico que a minha pesquisa prova que moedas jogadas dão cara 80% das vezes. Considerando que dificilmente existe um resultado homogêneo na distribuição de caras e coroas, isso não deveria significar muita coisa; a faixa de variação é facilmente ignorada.

Non Sequitur

Essa é uma falácia na qual a conclusão não decorre das premissas, ou seja, não existe uma relação direta entre um primeiro evento e um segundo.

Se eu lhe disser que morreram mais pessoas em aviões no ano passado do que em 1960, posso usar isso para argumentar que aviões modernos são menos seguros. Porém isso não faz sentido, pois o número de pessoas que viajam de avião hoje em dia é notavelmente maior do que no século passado. Da mesma forma é um equívoco eu lhe dizer que aumentou o número de assaltos com faca, quando na verdade o que aumentou foi apenas o número de relatos.


É muito fácil interpretar errado dados estatísticos (e argumentos em geral), principalmente quando queremos muito que eles sejam verdadeiros ou falsos. Quando uma informação dessa natureza lhe for fornecida, sempre se pergunte quem originalmente está dizendo e qual a sua credibilidade, procure saber como o pesquisador soube daquilo (como se a amostra é grande o bastante para permitir uma conclusão confiável, por exemplo). Não se esqueça também dos dados que podem estar ocultos, pois eles podem ser isolados e tirados de contexto para favorecer sensacionalismos. É preciso sempre manter o pé atrás, pois a carência de dúvidas gera um terreno fértil para a enganação.


Vale lembrar a todos que existem outros inúmeros temas que trabalham com falácias e vieses cognitivos, a estatística é só um deles. As discussões abordadas aqui comigo tentarão explorar melhor isso. Quem estiver mais interessado nesse tema, recomendo muito o livro.