Teorema de Bayes & Probabilidade
Passo a passo de como calcular probabilidades condicionais
Se 2 eventos não forem independenteUma das mais famosas maneiras de se calcular a possibilidade de ocorrência de um evento é por meio da alteração das probabilidades condicionais. Mas vamos partir desde o princípio, revendo os conceitos básicos de probabilidade e probabilidade condicional para por fim entendermos o Teorema de Bayes por completo.
Probabilidade:
A probabilidade é uma forma de quantificar a incerteza associada a uma amostra escolhida dentro de um conjunto universo. Vamos descrever isso da seguinte forma:
Usando a teoria da probabilidade vista acima, é possível construir modelos probabilísticos com aplicações muito interessantes no cotidiano.
Dependência e Independência:
Vamos se dizer que existam 2 eventos (A e B), e que se o acontecimento de A nos dar informações sobre a ocorrência de B (ou mesmo ao contrário) iremos dizer que esses eventos são dependentes. Mas se a ocorrência de um não nos informar nada sobre o outro, podemos considerá-los como independentes.
Se 2 eventos não forem independentes, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:: Imagine um jogo de cara ou coroa com uma moeda não viciada, em que a moeda vai ser lançada 2 vezes. O resultado de se jogar a moeda na primeira rodada não afeta o resultado de se jogar a moeda pela segunda vez. Podemos considerar que o evento de se jogar a primeira moeda é independente do evento de se jogar a segunda. Mas o resultado de se jogar a primeira moeda nos dá informações sobre o resultado final das duas partidas. (isso mostra que o evento do resultado final das partidas é dependente do evento de se jogar a primeira moeda)
Podemos descrever matematicamente a independência entre dois eventos apenas multiplicando a probabilidade de cada um deles ocorrer, ou seja:
Probabilidade Condicional:
Se 2 eventos não forem independente, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:
Se A e B são 2 eventos na mesma amostra, então probabilidade condicional pode ser descrita da forma acima SOMENTE SE P(B) FOR DIFERENTE DE 0.
Isso pode ser lido também como “Uma vez que conhecemos o evento A sabemos que B acontece”.
Exemplo: Vamos jogar um dado não viciado. O evento A é jogar o dado e cair um número ímpar {1, 3, 5}. Já o evento B é jogar um dado e cair um número menor ou igual a 3 {1, 2, 3}. As perguntas lançadas são:
Qual o valor de P(A)?
E de A dado que B ocorreu, ou seja P(A|B) ?
Regras especiais:
- Probabilidade Complementar:
Em probabilidade, todo evento tem seu complementar. Vamos supor, o evento A é complementado pelo evento não A (¬A) em um espaço amostral S. Um bom exemplo é usar os números de um dado, onde o conjunto A é representado pelos números pares e o complementar de A os números ímpares:
- Complementar usando condicional:
Usando um axioma (verdade inquestionável) da probabilidade, é definido que P(¬A|B) = 1 - P(A|B). Isso acontece pelo momento que da fórmula de probabilidade condicionada em que acontece a interseção dos conjuntos. Vamos ver isso usando o mesmo exemplo dos dados como no tópico anterior:
- A e B disjuntos:
Quando 2 eventos são disjuntos, é o mesmo que dizer que eles não podem acontecer ao mesmo tempo, logo a interseção entre eles é um conjunto vazio:
- B é um subconjunto de A. (B ⊂ A): Então qualquer coisa que acontecer em B, também aconteceu em A. Sendo assim, se B é um subconjunto de A então P(A|B) tem 100% de chances de ocorrer:
- A é um subconjunto de B. (A ⊂ B): se A é um subconjunto de B, então qualquer coisa que acontecer em A, também aconteceu em B, logo:
Exemplo: Uma família com 2 filhos desconhecidos. Presumimos que:
- É igualmente possível que cada criança seja menino ou menina.
- O gênero da segunda criança é independente do gênero da primeira, então o evento “nenhuma menina” tem a probabilidade de 1/4, o evento “uma menina e um menino” tem probabilidade de 1/2 e “duas meninas” tem 1/4.
Agora, qual a probabilidade do evento “duas crianças são meninas” (X) ser condicionada pelo evento (Y) “a criança mais velha é uma menina” ?
Note que a probabilidade das 2 crianças serem meninas existe dentro da probabilidade da mais velha ser uma menina, isso indica que (X ⊂ Y).E usando a probabilidade condicional descobriremos o resultado:
Também podemos perguntar da probabilidade de “as duas crianças são meninas” (X) ser condicionada ao evento “ao menos uma das crianças é menina”(Z).
Se ambas são meninas, é verdade que uma delas é menina, assim vemos que (X⊂ Z). A probabilidade de P(Z) é a soma das probabilidades de “um menino e uma menina” e “duas meninas”. E assim temos:
Cadeia Codicional de Probabilidade
O último tópico que precisamos saber antes de entender por completo o Teorema de Bayes é a Cadeia Condicional de probabilidade, que basicamente é a possibilidade de dividir a probabilidade de um evento usando a probabilidade condicional.
A probabilidade de um evento A ocorrer é composto pela soma da sua probabilidade condicionada em B e da sua probabilidade condicionada em ¬B.
E por sua vez, a probabilidade total do evento é a soma das probabilidades de A e de ¬A. Vamos descrever isso visualmente:
O que o diagrama tenta descrever é que, a probabilidade de um evento acontecer é esse evento condicionado a um segundo evento OU condicionado ao complementar deste segundo evento, por isso usamos a soma para decompor os valores.
Vamos ilustrar isso com um problema. Uma moeda não viciada vai ser lançada 2 vezes e vamos acompanhar a ocorrência das jogadas usando a cadeia condicionada. Repare que a segunda linha representa a sua possibilidade dada a ocorrência da primeira:
Teorema de Bayes
A ideia principal do Teorema de Bayes é inverter as probabilidades condicionais. Por exemplo, queremos saber a probabilidade P(X|Y) mas conhecemos apenas a probabilidade de P(Y|X).
Antes, vamos reescrever a nossa fórmula da probabilidade condicional para utilizarmos de uma forma melhor. Vamos passar o denominador multiplicando para o outro lado da equação:
Dado que conhecemos P(A|B), queremos descobrir P(B|A), para isso vamos usar o que aprendemos com a variação da regra da probabilidade condicional e montar a tão famosa fórmula do Teorema de Bayes:
Exemplo:
Vamos a um típico problema que o Teorema de Bayes é usado: Uma certa doença afeta 1 a cada 10,000 pessoas. Existe um teste para verificar se a pessoa possui a doença ou não.
Desse problema sabemos que:
- A probabilidade do teste dar positivo, dado que a pessoa não tem a doença é de 2%.
- A probabilidade do teste dar negativo, dado que a pessoa possui a doença é de apenas 1%.
Se uma pessoa aleatória fizer o teste da doença e der positivo, qual é a probabilidade de que a pessoa tenha a doença ?
Vamos dizer que D é o evento em que a pessoa tenha a doença, e que T seja o evento em que o teste tenha dado positivo. Logo queremos descobrir P(D|T).
Até então conhecemos:
- P(D) = 0.0001
- P(T|¬D) = 0.02
- P(¬T|D) = 0.01
E com apenas essas informações podemos usar o Teorema de Bayes da seguinte forma:
Primeiro vamos decompor os valores que iremos usar com base no que conhecemos, aqui vamos o pôr em prática o complementar usando condicional.
Logo, vamos reescrever P(T) de uma forma que conhecemos os valores. Aqui usaremos a cadeia da probabilidade condicionada:
Vamos aplicar tudo em cima da fórmula do Teorema de Bayes e descobrir o resultado de P(D|T):
Com isso podemos responder que as pessoas que obtiveram o teste com resultado positivo e possuem a doença representam menos de meio por cento.
Uma explicação detalhada que podemos fazer, é que, de uma população com 1,000,000 pessoas, é esperado que apenas 100 delas tivessem a doença. E que 99 (0.5% da população) dessas 100 pessoas com a doença, tenha obtido o resultado do teste como positivo.
Já olhando para as outras 999,900 pessoas que não tiveram a doença, é esperado que 9,999 de seus testes mostrassem resultados positivo.
Ao todo, era esperado que houvesse 10,098 testes positivos, mas que apenas 99 deles fossem realmente de pessoas com a doença.
Fim!
Galera, tudo bom ? Peç odesculpas pelo tamanho do artigo, mas eu quis detalhar tudo que seria necessário para entender o Teorema de Bayes desde o princípio, pois foi uma dor minha desde a primeira vez que eu comecei a estudá-lo. Não havia uma explicação detalhada e ilustrada de como o teorema é construído e usado. Espero que gostem!