Teorema de Bayes & Probabilidade

Lauro Oliveira
Data Hackers
Published in
8 min readMay 19, 2020

Passo a passo de como calcular probabilidades condicionais

Foto de Unplash tirada por Roman Lazygeek

Se 2 eventos não forem independenteUma das mais famosas maneiras de se calcular a possibilidade de ocorrência de um evento é por meio da alteração das probabilidades condicionais. Mas vamos partir desde o princípio, revendo os conceitos básicos de probabilidade e probabilidade condicional para por fim entendermos o Teorema de Bayes por completo.

Probabilidade:

A probabilidade é uma forma de quantificar a incerteza associada a uma amostra escolhida dentro de um conjunto universo. Vamos descrever isso da seguinte forma:

Usando a teoria da probabilidade vista acima, é possível construir modelos probabilísticos com aplicações muito interessantes no cotidiano.

Dependência e Independência:

Vamos se dizer que existam 2 eventos (A e B), e que se o acontecimento de A nos dar informações sobre a ocorrência de B (ou mesmo ao contrário) iremos dizer que esses eventos são dependentes. Mas se a ocorrência de um não nos informar nada sobre o outro, podemos considerá-los como independentes.

Se 2 eventos não forem independentes, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:: Imagine um jogo de cara ou coroa com uma moeda não viciada, em que a moeda vai ser lançada 2 vezes. O resultado de se jogar a moeda na primeira rodada não afeta o resultado de se jogar a moeda pela segunda vez. Podemos considerar que o evento de se jogar a primeira moeda é independente do evento de se jogar a segunda. Mas o resultado de se jogar a primeira moeda nos dá informações sobre o resultado final das duas partidas. (isso mostra que o evento do resultado final das partidas é dependente do evento de se jogar a primeira moeda)

Podemos descrever matematicamente a independência entre dois eventos apenas multiplicando a probabilidade de cada um deles ocorrer, ou seja:

A probabilidade de A e B acontecer é igual a probabilidade de A multiplicado pela probabilidade de B

Probabilidade Condicional:

Se 2 eventos não forem independente, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:

A probabilidade do evento A condicionado ao evento B.

Se A e B são 2 eventos na mesma amostra, então probabilidade condicional pode ser descrita da forma acima SOMENTE SE P(B) FOR DIFERENTE DE 0.

Isso pode ser lido também como “Uma vez que conhecemos o evento A sabemos que B acontece”.

Exemplo: Vamos jogar um dado não viciado. O evento A é jogar o dado e cair um número ímpar {1, 3, 5}. Já o evento B é jogar um dado e cair um número menor ou igual a 3 {1, 2, 3}. As perguntas lançadas são:

Qual o valor de P(A)?

Calculando o valor de P(A)

E de A dado que B ocorreu, ou seja P(A|B) ?

Calculando o valor da probabilidade de A condicionada a B

Regras especiais:

  • Probabilidade Complementar:
    Em probabilidade, todo evento tem seu complementar. Vamos supor, o evento A é complementado pelo evento não A (¬A) em um espaço amostral S. Um bom exemplo é usar os números de um dado, onde o conjunto A é representado pelos números pares e o complementar de A os números ímpares:
Probabilidade de um evento complementar
  • Complementar usando condicional:
    Usando um axioma (verdade inquestionável) da probabilidade, é definido que P(¬A|B) = 1 - P(A|B). Isso acontece pelo momento que da fórmula de probabilidade condicionada em que acontece a interseção dos conjuntos. Vamos ver isso usando o mesmo exemplo dos dados como no tópico anterior:
Complementar usando condicional
  • A e B disjuntos:
    Quando 2 eventos são disjuntos, é o mesmo que dizer que eles não podem acontecer ao mesmo tempo, logo a interseção entre eles é um conjunto vazio:
Disjunção dos conjuntos A e B na amostra S
Disjunção dos conjuntos na probabilidade condicional.
  • B é um subconjunto de A. (B ⊂ A): Então qualquer coisa que acontecer em B, também aconteceu em A. Sendo assim, se B é um subconjunto de A então P(A|B) tem 100% de chances de ocorrer:
B sendo subconjunto de A
Se B é subconjunto de A, então P(A|B) = 1
  • A é um subconjunto de B. (A ⊂ B): se A é um subconjunto de B, então qualquer coisa que acontecer em A, também aconteceu em B, logo:
A sendo subconjunto de B
Probabilidade de P(A|B) se A for subconjunto de B

Exemplo: Uma família com 2 filhos desconhecidos. Presumimos que:

  1. É igualmente possível que cada criança seja menino ou menina.
  2. O gênero da segunda criança é independente do gênero da primeira, então o evento “nenhuma menina” tem a probabilidade de 1/4, o evento “uma menina e um menino” tem probabilidade de 1/2 e “duas meninas” tem 1/4.

Agora, qual a probabilidade do evento “duas crianças são meninas” (X) ser condicionada pelo evento (Y) “a criança mais velha é uma menina” ?

Note que a probabilidade das 2 crianças serem meninas existe dentro da probabilidade da mais velha ser uma menina, isso indica que (X ⊂ Y).E usando a probabilidade condicional descobriremos o resultado:

Resolução P(X|Y)

Também podemos perguntar da probabilidade de “as duas crianças são meninas” (X) ser condicionada ao evento “ao menos uma das crianças é menina”(Z).

Se ambas são meninas, é verdade que uma delas é menina, assim vemos que (X⊂ Z). A probabilidade de P(Z) é a soma das probabilidades de “um menino e uma menina” e “duas meninas”. E assim temos:

Probabilidade de P(X|Z)

Cadeia Codicional de Probabilidade

O último tópico que precisamos saber antes de entender por completo o Teorema de Bayes é a Cadeia Condicional de probabilidade, que basicamente é a possibilidade de dividir a probabilidade de um evento usando a probabilidade condicional.

A probabilidade de um evento A ocorrer é composto pela soma da sua probabilidade condicionada em B e da sua probabilidade condicionada em ¬B.

E por sua vez, a probabilidade total do evento é a soma das probabilidades de A e de ¬A. Vamos descrever isso visualmente:

Probabilidade condicional em cadeia

O que o diagrama tenta descrever é que, a probabilidade de um evento acontecer é esse evento condicionado a um segundo evento OU condicionado ao complementar deste segundo evento, por isso usamos a soma para decompor os valores.

Vamos ilustrar isso com um problema. Uma moeda não viciada vai ser lançada 2 vezes e vamos acompanhar a ocorrência das jogadas usando a cadeia condicionada. Repare que a segunda linha representa a sua possibilidade dada a ocorrência da primeira:

Cadeia de probabilidade de cara ou coroa (com 2 rodadas)

Teorema de Bayes

A ideia principal do Teorema de Bayes é inverter as probabilidades condicionais. Por exemplo, queremos saber a probabilidade P(X|Y) mas conhecemos apenas a probabilidade de P(Y|X).

Antes, vamos reescrever a nossa fórmula da probabilidade condicional para utilizarmos de uma forma melhor. Vamos passar o denominador multiplicando para o outro lado da equação:

Variação da regra da probabilidade condicional.

Dado que conhecemos P(A|B), queremos descobrir P(B|A), para isso vamos usar o que aprendemos com a variação da regra da probabilidade condicional e montar a tão famosa fórmula do Teorema de Bayes:

Formulando o Teorema de Bayes

Exemplo:

Vamos a um típico problema que o Teorema de Bayes é usado: Uma certa doença afeta 1 a cada 10,000 pessoas. Existe um teste para verificar se a pessoa possui a doença ou não.

Desse problema sabemos que:

  • A probabilidade do teste dar positivo, dado que a pessoa não tem a doença é de 2%.
  • A probabilidade do teste dar negativo, dado que a pessoa possui a doença é de apenas 1%.

Se uma pessoa aleatória fizer o teste da doença e der positivo, qual é a probabilidade de que a pessoa tenha a doença ?

Vamos dizer que D é o evento em que a pessoa tenha a doença, e que T seja o evento em que o teste tenha dado positivo. Logo queremos descobrir P(D|T).

Até então conhecemos:

  • P(D) = 0.0001
  • P(T|¬D) = 0.02
  • P(¬T|D) = 0.01

E com apenas essas informações podemos usar o Teorema de Bayes da seguinte forma:

Primeiro vamos decompor os valores que iremos usar com base no que conhecemos, aqui vamos o pôr em prática o complementar usando condicional.

decompondo os valor parte 1

Logo, vamos reescrever P(T) de uma forma que conhecemos os valores. Aqui usaremos a cadeia da probabilidade condicionada:

decompondo os valores parte 2

Vamos aplicar tudo em cima da fórmula do Teorema de Bayes e descobrir o resultado de P(D|T):

Solucionando o problema com o Teorema de Bayes

Com isso podemos responder que as pessoas que obtiveram o teste com resultado positivo e possuem a doença representam menos de meio por cento.

Uma explicação detalhada que podemos fazer, é que, de uma população com 1,000,000 pessoas, é esperado que apenas 100 delas tivessem a doença. E que 99 (0.5% da população) dessas 100 pessoas com a doença, tenha obtido o resultado do teste como positivo.

Já olhando para as outras 999,900 pessoas que não tiveram a doença, é esperado que 9,999 de seus testes mostrassem resultados positivo.

Ao todo, era esperado que houvesse 10,098 testes positivos, mas que apenas 99 deles fossem realmente de pessoas com a doença.

Fim!

Galera, tudo bom ? Peç odesculpas pelo tamanho do artigo, mas eu quis detalhar tudo que seria necessário para entender o Teorema de Bayes desde o princípio, pois foi uma dor minha desde a primeira vez que eu comecei a estudá-lo. Não havia uma explicação detalhada e ilustrada de como o teorema é construído e usado. Espero que gostem!

--

--