Why?

Causalidade e escada da causação

Eduardo Farina
dadosesaude
Published in
3 min readSep 1, 2020

--

É de nossa natureza querer identificar a causa das coisas. Não adianta você falar que colocar o dedo na tomada pode dar choque, muitas crianças vão querer ir lá e colocar o dedo. Por que chove? Por que faz frio? Se eu tivesse tirado a roupa do varal, ainda assim teria chovido? Questionamentos causais sempre fizeram parte do imaginário humano. No entanto, ainda que nem sempre seja trivial identificar a causa de fenômenos, identificar relações causais na saúde seria extremamente importante.

Nesse post falaremos sobre “The Ladder of Causation”, ou “A Escada da Causação”, proposta por Judea Pearl, recipiente do ACM A. M. Turing Award, conhecido como “Nobel da Computação”, em seu livro The Book of Why.

O primeiro degrau

O primeiro degrau é o mais simples. Não explica NENHUMA relação causal. É o degrau onde a estatística por si só é suficiente para realizarmos nossas análises. As relações entre os fenômenos são relações estatísticas, medidas por associações e regressões.

Pode ser definida como P(X|Y) ou em um exemplo da saúde em que quero saber quão comum é tomar um determinado remédio entre pacientes que têm uma determinada doença. É comum pacientes com uma determinada doença (X) tomarem um determinado remédio (Y)? Consigo fazer uma predição sobre o paciente ter a doença X dado que ele toma o remédio (Y)?

P(TemDoença | TomaRemédio) ou P(X|Y)

O segundo degrau

Esse degrau se relaciona a experimentação e é onde chegamos normalmente com as pesquisas e ensaios clínicos randomizados. É avaliar a probabilidade de um evento Y ocorrer dado que eu realizei uma intervenção X, isto é, P(Y | do(X)). O operador do significa que houve uma intervenção para que essa variável X assumisse um valor X=x. Isso é diferente de estratificar para X=x e é possível quando você utiliza técnicas que conseguem modelar dados de um estudo observacional como se tivessem sido randomizados. Um exemplo de técnica para se alcançar isso é através do backdoor criterion.

No nosso exemplo do degrau anterior, será que esses pacientes com a doença (X) melhoraram (Y) dado que tenham tomado 10mg do remédio?

P(Melhorar | do(Tomar10mgRemédio)) ou P(Y|do(X))

O terceiro degrau

É o degrau do contrafactual, um degrau que só pode existir no nosso imaginário. Seria saber a Probabilidade de um evento Y ter ocorrido se o evento X tivesse ocorrido, ou de um evento Y não ter ocorrido se o evento X não tivesse ocorrido.

No nosso exemplo, poderia ser uma pergunta como “E se em vez de 10mg, o paciente tivesse tomado 20mg, teríamos observado o mesmo resultado?”

Um modo simples de se lembrar dos três degraus é pensar nas três palavrinhas a seguir, representando o primeiro, segundo e terceiro degrau: Ver, Fazer e Imaginar. Para chegar em qualquer degrau deve-se passar pelo degrau anterior.

Nós realizamos ensaios clínicos randomizados na saúde após avaliar alguma associação em estudo observacional. No entanto, devido a questões éticas, nunca chegaremos no segundo degrau para algumas perguntas → Tabagismo por exemplo: não podemos separar um grupo e mandá-los fumar e outro para não fumar. É com base nisso que técnicas de inferência causal em dados observacionais tornam-se tão importantes e com grande potencial.

Se achou o post interessante e quer se aprofundar em relações causais, confira o livro The Book of Why

Referências

--

--