Teorema de Bayes & Probabilidade

Published in

Data Hackers

8 min readMay 19, 2020

Passo a passo de como calcular probabilidades condicionais

Foto de Unplash tirada por Roman Lazygeek

Se 2 eventos não forem independenteUma das mais famosas maneiras de se calcular a possibilidade de ocorrência de um evento é por meio da alteração das probabilidades condicionais. Mas vamos partir desde o princípio, revendo os conceitos básicos de probabilidade e probabilidade condicional para por fim entendermos o Teorema de Bayes por completo.

Probabilidade:

A probabilidade é uma forma de quantificar a incerteza associada a uma amostra escolhida dentro de um conjunto universo. Vamos descrever isso da seguinte forma:

Usando a teoria da probabilidade vista acima, é possível construir modelos probabilísticos com aplicações muito interessantes no cotidiano.

Dependência e Independência:

Vamos se dizer que existam 2 eventos (A e B), e que se o acontecimento de A nos dar informações sobre a ocorrência de B (ou mesmo ao contrário) iremos dizer que esses eventos são dependentes. Mas se a ocorrência de um não nos informar nada sobre o outro, podemos considerá-los como independentes.

Se 2 eventos não forem independentes, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:: Imagine um jogo de cara ou coroa com uma moeda não viciada, em que a moeda vai ser lançada 2 vezes. O resultado de se jogar a moeda na primeira rodada não afeta o resultado de se jogar a moeda pela segunda vez. Podemos considerar que o evento de se jogar a primeira moeda é independente do evento de se jogar a segunda. Mas o resultado de se jogar a primeira moeda nos dá informações sobre o resultado final das duas partidas. (isso mostra que o evento do resultado final das partidas é dependente do evento de se jogar a primeira moeda)

Podemos descrever matematicamente a independência entre dois eventos apenas multiplicando a probabilidade de cada um deles ocorrer, ou seja:

A probabilidade de A e B acontecer é igual a probabilidade de A multiplicado pela probabilidade de B

Probabilidade Condicional:

Se 2 eventos não forem independente, podemos considerá-los como dependentes. Por exemplo, se tomarmos que A e B são dependentes, podemos dizer que “o evento A está condicionado ao evento B” e descrevemos isso da seguinte forma:

A probabilidade do evento A condicionado ao evento B.

Se A e B são 2 eventos na mesma amostra, então probabilidade condicional pode ser descrita da forma acima SOMENTE SE P(B) FOR DIFERENTE DE 0.

Isso pode ser lido também como “Uma vez que conhecemos o evento A sabemos que B acontece”.

Exemplo: Vamos jogar um dado não viciado. O evento A é jogar o dado e cair um número ímpar {1, 3, 5}. Já o evento B é jogar um dado e cair um número menor ou igual a 3 {1, 2, 3}. As perguntas lançadas são:

Qual o valor de P(A)?

E de A dado que B ocorreu, ou seja P(A|B) ?

Calculando o valor da probabilidade de A condicionada a B

Regras especiais:

Probabilidade Complementar:
Em probabilidade, todo evento tem seu complementar. Vamos supor, o evento A é complementado pelo evento não A (¬A) em um espaço amostral S. Um bom exemplo é usar os números de um dado, onde o conjunto A é representado pelos números pares e o complementar de A os números ímpares:

Complementar usando condicional:
Usando um axioma (verdade inquestionável) da probabilidade, é definido que P(¬A|B) = 1 - P(A|B). Isso acontece pelo momento que da fórmula de probabilidade condicionada em que acontece a interseção dos conjuntos. Vamos ver isso usando o mesmo exemplo dos dados como no tópico anterior:

A e B disjuntos:
Quando 2 eventos são disjuntos, é o mesmo que dizer que eles não podem acontecer ao mesmo tempo, logo a interseção entre eles é um conjunto vazio:

Disjunção dos conjuntos A e B na amostra S

Disjunção dos conjuntos na probabilidade condicional.

B é um subconjunto de A. (B ⊂ A): Então qualquer coisa que acontecer em B, também aconteceu em A. Sendo assim, se B é um subconjunto de A então P(A|B) tem 100% de chances de ocorrer:

Se B é subconjunto de A, então P(A|B) = 1

A é um subconjunto de B. (A ⊂ B): se A é um subconjunto de B, então qualquer coisa que acontecer em A, também aconteceu em B, logo:

Probabilidade de P(A|B) se A for subconjunto de B

Exemplo: Uma família com 2 filhos desconhecidos. Presumimos que:

É igualmente possível que cada criança seja menino ou menina.
O gênero da segunda criança é independente do gênero da primeira, então o evento “nenhuma menina” tem a probabilidade de 1/4, o evento “uma menina e um menino” tem probabilidade de 1/2 e “duas meninas” tem 1/4.

Agora, qual a probabilidade do evento “duas crianças são meninas” (X) ser condicionada pelo evento (Y) “a criança mais velha é uma menina” ?

Note que a probabilidade das 2 crianças serem meninas existe dentro da probabilidade da mais velha ser uma menina, isso indica que (X ⊂ Y).E usando a probabilidade condicional descobriremos o resultado:

Também podemos perguntar da probabilidade de “as duas crianças são meninas” (X) ser condicionada ao evento “ao menos uma das crianças é menina”(Z).

Se ambas são meninas, é verdade que uma delas é menina, assim vemos que (X⊂ Z). A probabilidade de P(Z) é a soma das probabilidades de “um menino e uma menina” e “duas meninas”. E assim temos:

Cadeia Codicional de Probabilidade

O último tópico que precisamos saber antes de entender por completo o Teorema de Bayes é a Cadeia Condicional de probabilidade, que basicamente é a possibilidade de dividir a probabilidade de um evento usando a probabilidade condicional.

A probabilidade de um evento A ocorrer é composto pela soma da sua probabilidade condicionada em B e da sua probabilidade condicionada em ¬B.

E por sua vez, a probabilidade total do evento é a soma das probabilidades de A e de ¬A. Vamos descrever isso visualmente:

O que o diagrama tenta descrever é que, a probabilidade de um evento acontecer é esse evento condicionado a um segundo evento OU condicionado ao complementar deste segundo evento, por isso usamos a soma para decompor os valores.

Vamos ilustrar isso com um problema. Uma moeda não viciada vai ser lançada 2 vezes e vamos acompanhar a ocorrência das jogadas usando a cadeia condicionada. Repare que a segunda linha representa a sua possibilidade dada a ocorrência da primeira:

Cadeia de probabilidade de cara ou coroa (com 2 rodadas)

Teorema de Bayes

A ideia principal do Teorema de Bayes é inverter as probabilidades condicionais. Por exemplo, queremos saber a probabilidade P(X|Y) mas conhecemos apenas a probabilidade de P(Y|X).

Antes, vamos reescrever a nossa fórmula da probabilidade condicional para utilizarmos de uma forma melhor. Vamos passar o denominador multiplicando para o outro lado da equação:

Dado que conhecemos P(A|B), queremos descobrir P(B|A), para isso vamos usar o que aprendemos com a variação da regra da probabilidade condicional e montar a tão famosa fórmula do Teorema de Bayes:

Exemplo:

Vamos a um típico problema que o Teorema de Bayes é usado: Uma certa doença afeta 1 a cada 10,000 pessoas. Existe um teste para verificar se a pessoa possui a doença ou não.

Desse problema sabemos que:

A probabilidade do teste dar positivo, dado que a pessoa não tem a doença é de 2%.
A probabilidade do teste dar negativo, dado que a pessoa possui a doença é de apenas 1%.

Se uma pessoa aleatória fizer o teste da doença e der positivo, qual é a probabilidade de que a pessoa tenha a doença ?

Vamos dizer que D é o evento em que a pessoa tenha a doença, e que T seja o evento em que o teste tenha dado positivo. Logo queremos descobrir P(D|T).

Até então conhecemos:

P(D) = 0.0001
P(T|¬D) = 0.02
P(¬T|D) = 0.01

E com apenas essas informações podemos usar o Teorema de Bayes da seguinte forma:

Primeiro vamos decompor os valores que iremos usar com base no que conhecemos, aqui vamos o pôr em prática o complementar usando condicional.

Logo, vamos reescrever P(T) de uma forma que conhecemos os valores. Aqui usaremos a cadeia da probabilidade condicionada:

Vamos aplicar tudo em cima da fórmula do Teorema de Bayes e descobrir o resultado de P(D|T):

Solucionando o problema com o Teorema de Bayes

Com isso podemos responder que as pessoas que obtiveram o teste com resultado positivo e possuem a doença representam menos de meio por cento.

Uma explicação detalhada que podemos fazer, é que, de uma população com 1,000,000 pessoas, é esperado que apenas 100 delas tivessem a doença. E que 99 (0.5% da população) dessas 100 pessoas com a doença, tenha obtido o resultado do teste como positivo.

Já olhando para as outras 999,900 pessoas que não tiveram a doença, é esperado que 9,999 de seus testes mostrassem resultados positivo.

Ao todo, era esperado que houvesse 10,098 testes positivos, mas que apenas 99 deles fossem realmente de pessoas com a doença.

Fim!

Galera, tudo bom ? Peç odesculpas pelo tamanho do artigo, mas eu quis detalhar tudo que seria necessário para entender o Teorema de Bayes desde o princípio, pois foi uma dor minha desde a primeira vez que eu comecei a estudá-lo. Não havia uma explicação detalhada e ilustrada de como o teorema é construído e usado. Espero que gostem!

Data Hackers

Teorema de Bayes & Probabilidade

Probabilidade:

Dependência e Independência:

Probabilidade Condicional:

Regras especiais:

Cadeia Codicional de Probabilidade

Teorema de Bayes

Sign up to discover human stories that deepen your understanding of the world.

Free

Membership

Published in Data Hackers

Written by Lauro Oliveira

No responses yet