Par ou ímpar? Aplicando o raciocínio probabilístico de maneira consistente.

Edson Nogueira
Suzano DigitalTech
Published in
5 min readDec 29, 2022

Introdução

Os conceitos fundamentais de estatística sempre geram discussões interessantes, tanto entre o público geral quanto entre profissionais que utilizam a estatística de maneira rotineira em suas atividades.Nesse contexto, talvez nenhum conceito cause mais confusão nas discussões do que o de probabilidade. Em particular, mesmo entre profissionais experientes é comum vermos aplicações equivocadas deste conceito.

Podemos considerar como um exemplo famoso o problema de Monty Hall, resolvido por Marilyn vos Savant e no qual mesmo doutores (!) em Matemática discordaram da solução correta antes de verem uma simulação computacional, incluindo o notável Paul Erdös. Uma discussão detalhada e envolvente deste caso pode ser vista no livro O andar do bêbado: como o acaso determina nossas vidas, de Leonard Mlodinow, que considero um dos melhores livros que já li até hoje!

Uma enquete publicada no Linkedin por Henrique Junqueira Branco, que atua na área de dados como Engenheiro de Machine Learning, perguntava sobre quem tem mais chances de ganhar no par ou ímpar. Vários profissionais e estudantes da área de Ciência de Dados comentaram, e uma quantidade considerável dos participantes votou a favor da escolha ‘par’ usando argumentos que, embora pareçam plausíveis, estão equivocados quando levamos em conta a definição de probabilidade.

Assim, desenvolvi um projeto cujo objetivo foi usar a minha experiência acadêmica, com forte ênfase em raciocínio analítico e domínio dos conceitos fundamentais da estatística, e minhas habilidades de programação com a linguagem Python para contribuir com a melhoria da qualidade do raciocínio probabilístico na comunidade de Ciência de Dados, ou mesmo do público geral.

Resultados

Os principais resultados obtidos foram:

  • Demonstração de que, considerando o jogo “clássico” de par ou ímpar, onde cada jogador coloca apenas uma mão, isto é, seleciona um número inteiro entre 0 e 5, a probabilidade de o resultado ser par ou ímpar é de 50% cada.

Esta demonstração se baseia na definição de probabilidade, isto é, fazendo a enumeração de todos os resultados possíveis (espaço amostral) e definindo um evento favorável (por exemplo, “soma das mãos deu ímpar”). Então, a probabilidade do evento favorável seria a proporção entre os eventos favoráveis e os eventos totais.

Tabela contendo uma enumeração de todos os eventos do jogo de par ou ímpar descrito no problema.

Neste caso, onde é factível fazer a contagem dos eventos, podemos facilmente obter que o número de eventos favoráveis (ímpar) é 18, o que leva a Prob(ímpar) = 18/36 = 50%.

  • Refutação do seguinte argumento: “Cada jogador escolhe um número, que pode ser par ou ímpar. Como par + par = par, ímpar + ímpar = par e par + ímpar = ímpar, há mais possibilidades onde o resultado final é par.”

Notamos aqui que há uma tentativa similar à anterior, de contar os eventos possíveis e, neste caso, perceber que o evento “par” possui mais eventos no espaço amostral do que o evento ímpar. Entretanto, este raciocínio falha pois a maneira com que os eventos são divididos neste caso não possuem a mesma cardinalidade, como acontecia no caso anterior onde foi enumerada cada possibilidade de valores das duas mãos de cada jogador.

Distribuição dos possíveis resultados em eventos do tipo 0 (cada jogador joga um número par), tipo 1 (um jogador joga um número par e o outro joga um número ímpar) e tipo 2 (cada jogador joga um número ímpar).

O gráfico acima nos mostra que, de fato, embora haja dois “tipos” de evento favoráveis ao resultado par e apenas um “tipo” favorável ao resultado ímpar, a cardinalidade deste último (e consequentemente sua probabilidade de ocorrência) é o dobro da cardinalidade dos dois anteriores, de modo que ao somarmos as probabilidade de cada tipo de evento e associarmos aos resultados correspondentes obteremos a probabilidade de 50% para cada um, como demonstrado anteriormente.

  • Refutação do seguinte argumento: “Após somar as mãos dos jogadores, há 6 resultados pares possíveis (0, 2, 4, 6, 8, 10) e apenas 5 ímpares (1, 3, 5, 7, 9). Logo, quem escolhe par tem mais chances de ganhar.”

Novamente o problema consiste em contar os eventos possíveis, perceber que o evento “par” possui mais eventos no espaço amostral do que o evento ímpar, mas sem notar que a maneira com que os eventos são divididos não possuem a mesma cardinalidade.

Distribuição dos possíveis resultados pelo valor da soma das mãos dos jogadores.

O gráfico acima nos mostra que, de fato, embora haja seis valores de soma das mãos favoráveis ao resultado par e cinco favoráveis ao resultado ímpar, quando levamos em conta as cardinalidades (e, consequentemente, a probabilidade) dessas somas, obteremos a probabilidade de 50% para par e 50% para ímpar, como se segue:

Prob(par) = Prob(soma = 0) + Prob(soma = 2) + Prob(soma = 4) + Prob(soma = 6) + Prob(soma = 8) + Prob(soma = 10) = 2,78% + 8,33% + 13,89% + 13,89% + 8,33% + 2,78% = 50%.

Conclusão

O conceito de probabilidade, que pode se dizer que seja um dos mais fundamentais da estatística, envolve sutilezas que podem se manifestar mesmo em aplicações consideradas triviais à primeira vista, como o exemplo do jogo de par ou ímpar.

Neste artigo, discutimos como certos argumentos probabilísticos empregados no contexto do par ou ímpar, usados mesmo por alguns profissionais e estudantes da área de Ciência de Dados, podem parecer bem embasados mas, quando analisados à luz da definição de probabilidade, na verdade são equivocados.

Assim, espero que esta discussão contribua para um melhor entendimento dos conceitos fundamentais da estatística tanto para pessoas relacionadas com aárea de Ciência de Dados ou mesmo do público em geral.

Comentários Finais

Os gráficos e a tabela utilizados neste texto, bem como mais detalhes sobre os cálculos e o desenvolvimento podem ser encontrados no repositório associado ao projeto no qual este artigo foi baseado como uma descrição estendida.

Obrigado a você que leu o artigo até aqui. Esta foi a minha primeira publicação no Medium, então quaisquer críticas construtivas são muito bem vindas para que eu melhore nas próximas.

Espero que este artigo tenha contribuído para sua formação, seja através de um conhecimento novo ou uma leitura agradável sobre algo que você já conhecia mas não com a mesma perspectiva. Abraços e tudo de bom!

--

--

Edson Nogueira
Suzano DigitalTech

I am a Data Engineer @ Artefact and Ph.D. in Physics.