Correlação não implica em Causalidade

nabla
3 min readFeb 23, 2017

--

Primeiramente, em Estatística, Correlação é um conceito que se refere à medida da relação entre duas variáveis. Por exemplo, pensemos nas variáveis quantidade de sorvetes vendidos e temperatura — em dias de calor acentuado, verifica-se que a quantidade de sorvetes vendidos tende a ser mais elevada. Isto é, diz-se que há uma correlação positiva entre temperaturas e quantidade de sorvetes vendidos. A correlação ainda pode ser nula (ou quase nula), por exemplo, quando tentamos relacionar o consumo de arroz e feijão com a temperatura — esse consumo tende a não variar expressivamente em decorrência da mudança de temperatura, diz-se então que a correlação entre o consumo de arroz e feijão e a temperatura é (praticamente) nula.

Outro conceito importante é o de Causalidade, em que há relação entre uma variável X e uma variável Y e a variável Y é consequência da variável X, ou dito de outra maneira, a variável X é causa da variável Y. Ainda no exemplo da temperatura e da quantidade vendida de sorvete, podemos identificar que dias de temperaturas mais altas implicam em uma maior quantidade média de sorvetes vendidos. Isto é, dadas as preferência das pessoas de consumirem mais sorvetes em dias de calor, quando a temperatura aumenta, em média, a quantidade de sorvete vendida também aumenta. Com o devido embasamento teórico a respeito das preferências das pessoas, pode-se concluir que o aumento de temperatura é a causa da elevação na venda de sorvetes.

Dado que os termos já foram explicados, vamos ao assunto principal do texto: Correlação não implica em Causalidade. O que isto quer dizer? Bem, voltando ao exemplo do calor e do sorvete, notamos que a correlação entre temperaturas e vendas de sorvete é positiva e a causa do aumento da quantidade vendida é o calor. Todavia, não podemos de modo algum dizer que se vendermos mais sorvetes a temperatura do dia ficará mais elevada. Ou seja, não se pode afirmar que a causa do calor seja o aumento das vendas. O que nos faz chegar à nossa conclusão: Correlação não implica em Causalidade.

Dizer que Correlação não implica em Causalidade, quer dizer que duas coisas correlacionadas não implicam, necessariamente, no fato de uma ser causa da outra. Um exemplo palpável que cabe bem à situação seria a seguinte afirmativa: em países do hemisfério norte nota-se que as pessoas tendem a gastar mais em compras no frio. Apesar do gasto em compras estar correlacionado negativamente com a temperatura (- temperatura, + compras), não quer dizer que o frio cause um aumento nas vendas. Uma explicação mais plausível para esse constatado é que datas festivas — como o Natal, por exemplo — coincidem com épocas de frio nos países situados ao norte da Linha do Equador.

Nossas crenças e preconceitos nos levam a concluir erroneamente que fatos correlacionados possuem relação de causalidade mesmo quando não há uma evidência para isso, o que acaba por empobrecer muitos debates, tornando-os rasos. Um outro exemplo, bem desconexo, seria: alguém tenta te convencer que o número de pessoas afogadas em piscinas é causa das aparições do Nicolas Cage em filmes (imagem abaixo). Você deveria acreditar? Saiba que esses dois eventos estiveram correlacionados (estatísticamente falando) durante certo período, mas obviamente não possuem relação de causa. Fatos como esse, por exemplo, que não apresentam nenhuma relação, muito menos de causa direta ou indireta, acontecem por “força do acaso” e são denominados correlações espúrias e, apesar de óbvios, também ilustram muito bem o argumento de que Correlação não implica em Causalidade.

Podemos verificar mais exemplos irreverentes, como esse, no link http://www.tylervigen.com/spurious-correlations.

Igor Soares — Graduando em Ciências Econômicas pela Unversidade de São Paulo

--

--