Inferência estatística em uma frase

Traduzido por Victor Tseimazides do original de Cassie Kozyrkov

Todo teste de hipóteses — dos cursos de estatística básica aos mais assustadores exames de qualificação de PhD — se resume a uma frase. É o grande insight dos anos 20 que deu luz à maioria das atividades estatísticas que você encontra na natureza hoje. Você pode derivar nossa disciplina daí, então se você quer entender estatística, guarde bem esta frase e medite sobre ela diariamente.

R.A. Fisher (1890–1962, inglês) é amplamente considerado o pai da estatística moderna. Se você quer alguém para culpar sobre o conteúdo deste artigo, ele é o seu cara.

Chega de preâmbulos! Eis o encantamento mágico:

“A evidência que coletamos faz com que nossa hipótese nula pareça ridícula?”

Eu não estou brincando; isto é tudo. Isto é teste de hipóteses clássico. A. Cada. Momento. Vê-lo sem seus dentes e garras pode até parecer uma decepção para aqueles que carregam cicatrizes de dos cursos de estatística básica. Outros de vocês podem estar se esforçando para fazer disso um cara ou coroa, então vamos dar uma olhada em um exemplo legal.

Teste de hipóteses com alienígenas

Você acaba de ser selecionado para a grande aventura: buscar vida alienígena em outros planetas. Infelizmente, assim como acontece com todo trabalho dos sonhos, há… um gerente. Seu gerente malvado te deu uma interface de usuário bastante simples. Tem apenas dois botões: SIM e NÃO.

Isto é tudo o que há no seu painel de controle. SIM, há vida alienígena aqui. NÃO, não há vida alienígena aqui. Não há maneiras de incluir um “talvez”, comentários ou limites.

Em um outro golpe de tirania, seu gerente não lhe deu o orçamento para pesquisar um planeta inteiro. Tudo o que você consegue fazer é aterrissar, escolher uma direção, começar a andar até que seu suprimento de oxigênio fique escasso, depois voltar e pressionar um desses dois botões. Como você só aterrissará em planetas grandes e não terá oxigênio suficiente no tanque para vasculhar cada centímetro de sua superfície, enfrentará incertezas: você pode acabar não sabendo qual é a verdadeira resposta.

Passo 1: Qual a ação padrão?

Todo teste de hipóteses começa do mesmo lugar. Um tomador de decisão escolhe a ação padrão. Esta é a ação que você compromete a tomar caso você não encontre nenhuma evidência. Em outras palavras, se você nem mesmo pisar neste planeta, você irá apertar SIM ou NÃO?

Esta não é uma pergunta com uma resposta certa. É uma pergunta de MBA que realmente depende da política da sua empresa de exploração espacial, então vamos brincar com este exemplo com os dois possíveis padrões. Se você é como a maioria dos leitores, você preferiria o botão NÃO como padrão, então vamos começar com ele.

Ação padrão: Apertar o botão NÃO.

Passo 2: Qual a ação alternativa?

…e aqui você esperava que estatística fosse difícil. A ação alternativa é simplesmente o que você irá fazer caso você não tome a ação padrão.

Ação alternativa: Apertar o botão SIM.

Se você leu minha análise de como tudo isso funciona, vai lembrar que a única maneira de você acabar apertando SIM é se a evidência te faz estúpido caso aperte NÃO.

Passo 3: Qual a hipótese nula?

Você acaba de aterrissar em um planeta e se pergunta, “Se eu soubesse tudo sobre este planeta, quais circunstâncias fariam do botão NÃO uma escolha feliz?” Se não há vida alienígena no planeta. Bingo! Esta é a hipótese nula (H0).

H0: Não há vida alienígena neste planeta.

Passo 4: Qual a hipótese alternativa?

A hipótese alternativa (H1) é tudo o que é verdadeiro quando a nula for falsa.

H0: Não há vida alienígena neste planeta.
H1: Há vida alienígena neste planeta.

Ta-da! Você configurou suas hipóteses e está pronto para coletar e analisar alguns dados.

Colete dados

Você é uma alma diligente, então você não sai viajando pelos planetas apertando NÃO. Você irá aterrissar sua espaçonave, sair, e começar a andar em alguma direção miserável por três miseráveis horas, marchando de volta em seguida. E ao longo disso tudo, tudo o que você encontrou foi… nenhum alienígena.

Estatística: 0 (zero) alienígenas.

O que aprendemos de interessante?

Quando eu ensino isto em sala de aula, a resposta típica é, “Não houve alienígena visível nesta caminhada de três horas.” Essa é uma resposta sutilmente incorreta, por conta de como moldamos nossa tomada de decisão.

Como você molda sua tomada de decisão é importante. Nem todas as decisões funcionam com a abordagem ensinada nos cursos de estatística básica.

Ao nos envolvermos em estatística clássica, concordamos com um contrato legal que diz que apenas a população é interessante para nós. Essa é toda a superfície do planeta, não essa pequena amostra de uma caminhada de três horas.

Estatística básica: 0 (zero) alienígenas na caminhada de 3h.
Parâmetros da população: ?? alienígenas no planeta inteiro.

Se estivermos fazendo análise de dados, poderíamos nos entusiasmar por este pequeno fato que acabamos de observar, mas não é para isso que estamos aqui. Estamos fazendo estatística, então tudo o que não é informativo sobre o planeta inteiro é chato por definição. Não podemos dizer se não vimos alienígenas porque não há nenhum ou porque eles estão atrás daquela rocha que ainda não avistamos. Não temos nenhuma maneira de distinguir entre estas duas possibilidades. Então, vamos tentar de novo. É uma resposta de uma palavra. O que aprendemos de interessante?

Nada. Não aprendemos nada de interessante.

Isto é incrível. Você entende o que acaba de acontecer aqui?

Nós acabamos de analisar dados e nós (corretamente) não aprendemos nada sobre eles. Quão frequentemente nós nos permitimos fazer isso? Repita comigo: eu não aprendi nada e estou orgulhoso disso!

Você deveria criar o hábito de não aprender nada mais frequentemente, pois se você insiste em aprender algo além dos dados toda vez que testar hipóteses, você vai aprender algo estúpido.

Quando você está fazendo o tipo de inferência estatística que envolve intervalos de confiança e p-valores, não aprender nada é algo muito bom.

Isto não é analytics!

Se isto te irrita, respire fundo. Você pode estar pensando como um analista enquanto se aventura no território de estatísticas. Isto é perigoso!

Analytics se preocupa com o que está aqui, enquanto estatística se preocupa mais com o que não está.

Todo mundo pode fazer análise de dados: simplesmente olhe para um conjunto de dados e sumarize o que você vê. “Estes são os fatos nesta planilha. Nenhum alienígena observado.” Você sempre irá aprender algo interessante com análise de dados, pois o escopo do seu interesse são os dados que estão na sua cara. Análise de dados tem apenas uma regra de ouro: atenha-se aos dados e não vá além. Neste espaço seguro, a excelência é medida pela rapidez com que você consegue brincar com seus dados e você não pode errar… exceto se acidentalmente resolva se aventurar na estatística. Coisas assustadoras se escondem além dos seus dados.

Ver além da sua planilha sem se machucar requer uma mentalidade diferente, razão pela qual estatística é mais complicada. Como a gente chama um desses tipo de gente que anda por aí cuspindo matemática sem entender sua filosofia? Um perigo para si e para os outros.

Coisas sutis importam quando você luta com o desconhecido.

Algumas pessoas parecem pensar que sempre que analisam dados, o universo lhes deve insights além dos fatos. Se estamos fazendo um grande salto do que sabemos para o que não sabemos, por que esperamos que seja fácil?

Se você insiste em aprender algo toda vez que testar hipóteses, vai aprender algo estúpido.

Abrace a possibilidade de não aprender nada quando você faz estatística. (Começando por este artigo?)

O coração pulsante de tudo

Estatística é a ciência de mudar de ideia sob incertezas. Nós iremos mudar de ideia se nos sentirmos ridículos em persistir no que a nossa evidência chama de esforço tolo, razão pelo qual todo teste de hipóteses se resume à mesma questão principal:

“A evidência que coletamos faz com que a nossa hipótese nula pareça ridícula?”

De lição de casa, agora você pode ir em frente e derivar a maioria da estatística. (Ou você pode continuar lendo, isto é ok também.)

Analisando os dados alienígenas

Não encontramos nenhum alienígena na nossa caminhada e nossa hipótese nula é que não há alienígenas no planeta. Qual a nossa resposta para a grande questão de teste? A evidência faz com que nosso nulo pareça ridículo? Como poderia? Não ter alienígenas na nossa amostra é completamente consistente com não ter alienígenas na população.

Agora imagine que ao invés de não encontrar alienígenas na nossa caminhada, nós encontramos este carinha verde.

Assumindo que isto é um alienígena (e não um picles), o que aprendemos? Se eu te dissesse que eu encontrei este alienígena e ainda assim eu considero a possibilidade que não há vida alienígena neste planeta, você me diria que você encontrou uma idiota.

Esta evidência faz minha hipótese nula parecer ridícula! O que fazemos quando a hipótese nula pareça ridícula? Não nos apegamos a esta besteira. Livre-se disso!

Dado que fomos espertos em desenharmos nossas duas hipóteses de forma que elas abranjam todas as possibilidades, rejeitar uma nos obriga a aceitar a outra. Como bons Frequentistas, nós começamos sem opinião sobre o planeta. Nós temos uma ação favorita, claro, mas você não precisa ter opiniões para isto. Iniciantes parecem se atrapalhar com a diferença entre botões (ações) e entendimento dos planetas (hipóteses), mas você não vai, certo?

Se sente ridículo(a)? Rejeite!

Se nossa evidência nos fazer responder “sim” à nossa grande questão de teste, nós rejeitamos esta hipótese ridícula e concluímos a favor da alternativa. Agora nos sentimos ridículos de performar a ação padrão, então trocamos para ação alternativa e apertamos SIM. Então nós ganhamos conhecimento sobre o planeta como um todo: há vida nele!

Não se sente ridículo(a)? Não aprenda nada.

E quanto ao cenário em que respondemos “não” para a nossa questão de teste? Nos cursos de estatística básica, eles te ensinam a escrever um parágrafo complicado quando isso acontece. (“Nós falhamos em rejeitar a hipótese nula e concluímos que não há evidência estatística suficiente para suportar a existência de vida alienígena neste planeta.”) Estou convencida que o único propósito desta expressão é forçar os pulsos dos alunos. Eu sempre permiti que meus alunos escrevessem isto assim: não aprendemos nada de interessante.

Parabéns, você não aprendeu nada!

Não aprender nada parece uma tragédia. Nós colocamos um monte de esforço em coletar e analisar nossos dados… e o que tiramos disso? Nada?! Antes de chorarmos e batermos no peito, lembre-se de que nós não estamos aqui para saber das coisas. Estamos aqui para tomar decisões e nosso objetivo final é uma escolha sensata de ação, não conhecimento. Estamos aqui para pressionar um botão, caramba.

Bem, quando se trata de tomar decisões, este framework é realmente bem robusto. Nossa ação padrão é nossa apólice de seguro que faz com que seja ok não aprender nada. Ela nos dá um contrato que diz, “Se eu não sei nada, eis o que vou fazer sobre isso.”

Ao entrar nesse jogo de inferência, nós declaramos que estamos felizes em tomar nossa ação padrão em caso de ignorância… se este não é o caso, não deveríamos estar em estatística. Nada disso faz sentido sem uma ação padrão.

Nossa ação padrão era apertar o botão NÃO, então é isso o que fazemos quando falhamos em rejeitar a hipótese nula. Nós tomamos a ação com que estamos felizes pois não há razão para mudar de ideia. Esta é a ação correta? Não sei! Mas fizemos um esforço honesto para nos convencer disso e agora estamos seguindo o planejado com a consciência limpa.

Falhar em rejeitar a hipótese nula com certeza não significa que acreditamos que não há alienígenas aqui. Pelo que sabemos, eles estão se divertindo bem atrás daquela formação rochosa. Seríamos tolos de concluir que eles não estão lá só porque não os encontramos. Se eu passar 5 minutos procurando minhas chaves sem sucesso, não significa que elas não estão no meu apartamento. Significa que eu não sei onde elas estão. Existe uma diferença. (Seu senso de razão está te incomodando? Então leia isto.)

Sem razão para mudar de ideia? Siga em frente com a ação padrão como planejado. É a ação correta? ¯\_(ツ)_/¯ Bem-vindo(a) à incerteza.

Em resumo: o jogo de teste de hipóteses tem tudo a ver com determinar se a evidência que coletamos faz nossa hipótese nula parecer ridícula. Tudo depende de como nos sentimos sobre mudar de ideia quando há evidências.

Para ver o que seria diferente em um universo paralelo onde a ação padrão é SIM ao invés de NÃO, leia isto. (Dica: Tudo muda!)

Aprenda mais sobre ciência de dados e inteligência artificial em português.