O problema da ruína do jogador é um clássico em probabilidades.

Teoria da probabilidade: ruína do jogador.

Thomas Freud
thomasfreud
Published in
6 min readJun 20, 2020

--

Anteriormente analisamos os aspectos gerais a respeito de jogos justos. Citamos o exemplo de um jogo de cara e coroa, mostrando que se dois jogadores acordam em apostar nesse tipo de jogo, dado que ambos detém uma fortuna inicial equivalente, a riqueza esperada dos jogadores ao final de um número suficientemente grande de jogadas seria a mesma que a riqueza inicial de cada um deles. Esse problema é bastante conhecido em teoria das probabilidades e possui resultados interessantes, os quais são bastante analisados em assuntos mais teóricos da área, como no estudo de processos do tipo martingale e na argumentação heurística do movimento browniano tal como faz Paul Wilmott em Introduces quantitative finance.

A teoria da ruína é um tópico fundamental em modelagem de risco. Onde há incerteza e apostas, existirá sempre a probabilidade de ruína — vamos usar ruína como sinônimo de falência. Retomando de onde paramos no texto anterior, vamos pensar novamente no jogo de cara ou coroa.

Suponhamos que o jogador A e o jogador B concordam em jogar cara ou coroa. Se sair cara com probabilidade P(H) o jogador A recebe 1,00 de B, se sair coroa, B recebe 1,00 de A. A pergunta de interesse é, qual a probabilidade de A vencer o jogo dado que sua fortuna inicial era de i e a fortuna inicial de B é de N-i? A estratégia para formular matematicamente esse problema é pensar no teorema da probabilidade total e no conceito de probabilidade condicional, mas antes disso, vejamos o seguinte diagrama.

O jogador A começa o jogo com i em dinheiro e B com N-i, portanto, a soma em jogo corresponde a i + N-i = N. Temos dois estados, 0, que corresponde a ruína e 1 que corresponde a vitória. Se A ganha uma rodada, sua fortuna é incrementada por 1,00 e ele fica mais próximo do estado “rosa”. Por outro lado, com a vitória de A na jogada, B perde 1 unidade e se aproxima do estado verde. O jogo oscila entre esses estados, mas, eventualmente, irá convergir para um deles.

Existem várias formas de se modelar esse problema, inclusive usando apenas argumentos combinatórios, mas nós vamos usar uma estratégia diferente e mais curta. Primeira, vamos condicionar a probabilidade de A vencer ao resultado da primeira rodada, considerando sua fortuna inicial. Além disso, vamos supor que cada rodada é independente da outra. Portanto, seja E o evento “A conclui o jogo com todo o dinheiro, dado que começou com uma fortuna i e seu oponente com uma fortuna N-i”. Sendo assim, P(i)(E) representa a probabilidade desse evento. Usando o teorema da probabilidade total, podemos fazer obter a expressão seguinte.

Após o primeiro jogo, se saiu cara (H) na primeira jogada da moeda, a fortuna de A é agora i+1 e a de B é N-(i+1). Se saiu coroa (T), então a fortuna de A é i-1 e de B é N-(i-1) — observe o diagrama acima. A partir desse ponto, a probabilidade de A ganhar dado que saiu H na primeira jogada é equivalente a probabilidade de A vencer o jogo dado que começou a jogar com i+1 recursos. Entretanto, caso tenha ocorrido T, então seria equivalente a probabilidade de A vencer dado que começa com i-1 recursos. Logo, temos o seguinte resultado.

Temos, portanto, uma equação de diferenças — caso discreto de equações diferenciais — sujeita as condições iniciais dadas. Essas condições são bastante intuitivas: se A começa o jogo sem dinheiro pra aposta, então a probabilidade de ganhar é zero e se começa o jogo com toda a soma envolvida, então não há jogo e ele “ganha com probabilidade 1”.

Partindo da equação dada, é possível chegar a uma solução para P(i) quando p é diferente de q e quando p=q, nesse último caso dizemos que o jogo é justo. Duas estratégias podem ser usadas — ou mais — uma delas é resolver a equação usando métodos recursivos. Isso é possível ao verificarmos que:

E a partir da última igualdade, fazendo a recursão até N-i, com um pouco de álgebra e usando as condições iniciais, a solução aparece. Outro método é resolver a equação de diferenças considerando o método de solução com coeficientes constantes, tornando a equação não homogênea; e como as raízes do polinômio característico são distintas, a partir da combinação linear das raízes a solução equivalente é encontrada.

E essa é a expressão que modela nosso problema. Da pra fazer reflexões interessantes a partir dessa expressão. Primeiro vamos pensar na situação de um jogo justo, onde p=q. Em um jogo justo, a probabilidade de um sujeito jogando contra a banca vencer em cada rodada é calculada pela proporção de sua riqueza naquela rodada sobre o montante em jogo — dinheiro dele + dinheiro do cassino. Como o cassino tem mais dinheiro que o jogador, a desvantagem deste é clara como o sabre de luz de Obi-Wan.

Além disso, o jogo no cassino dificilmente é justo, ou seja, p não é igual a q. Em resumo, o jogador além de ter a desvantagem na assimetria da riqueza, tem a desvantagem no desequilíbrio do jogo.

Rodando uma simulação desse problema, essas conclusões podem ser vistas de forma mais direta. Considere o código abaixo.

Em princípio o jogo é equilibrado(q=p) e as fortunas dos jogadores são iguais, nesse cenário a probabilidade de o Jogador A vencer é de 50%. A trajetória de um dos jogos é tal qual apresentamos abaixo.

Realização de um jogo de cara ou coroa.

Nesse cenário, o jogo acabou depois de 200 rodadas, mas a média de jogadas — considerando 1000 repetições — é de 96 jogadas. O que acontece se aumentarmos a fortuna dos jogadores, digamos, 100,00 para cada um deles? A probabilidade de vitória do jogador A permanece aproximadamente 50%, mas agora o jogo durou, em média, 10.000 rodadas, com alguns jogos tomando 40.000 rodadas.

Simulação do problema da ruína do jogador

E se a fortuna do jogador A for 50 e a do jogador B for 150? Nesse caso, a probabilidade de A vencer cai para 25% com média de 7500 rodadas por jogo. Esse ponto ilustra a nossa primeira reflexão: O jogador com menor fortuna está em desvantagem e, ainda que a moeda seja justa, o jogo não será equilibrado. E se a moeda for viciada? Mantendo as fortunas iguais e fazendo P(H)=48%. Nesse caso a probabilidade de A ganhar é zero considerando uma média de 2500 rodadas por jogo. Considerando isso, mais o fato de que em um cassino a fortuna de A não é igual a de B (sendo B o cassino), temos uma visão bastante realista da situação.

Por fim, uma variável aleatória sobre a qual falamos nesse problema é o número de rodadas por jogo. Em teoria das martingales, essa variável é o “tempo de parada”, no caso discreto ela segue uma distribuição geométrica — pense no jogo como uma sequência de ensaios de variáveis aleatórias Bernoulli. Esse resultado é deveras importante e dotado de propriedades bastante úteis.

Abaixo temos o histograma correspondente a distribuição do número de rodadas até que um dos jogadores sofra ruína.

Número de rodadas até que ocorra ruína

Um exemplo de modelo probabilístico que pode ser obtido a partir do problema da ruína do jogador é o passeio aleatório, o qual é bastante relevante em teoria das probabilidades. O caso contínuo do passeio aleatório, denominado de movimento browniano, é um resultado importante em várias áreas, tais como finanças quantitativas e biologia.

Agora vamos pensar em uma aplicação para o problema que acabamos de modelar. Suponha uma seguradora que em um instante inicial possui uma reserva monetária (i ≥1), e a cada mês ela receberá 1,00 unidade em juros sobre a reserva, com probabilidade p, mas pagará 2,00 em sinistros que ocorrem com probabilidade q, no mesmo período. Qual a probabilidade de a seguradora eventualmente entrar em ruína se p=50% e se p <50%? A solução para esse segue precisamente o modelo abordado, e já sabemos a resposta. Basta substituirmos os parâmetros do problema no modelo encontrado ou no código fornecido e a resposta será encontrada.

--

--

Thomas Freud
thomasfreud

PhD Student, Actuary and master in statistics and probability | Accounting bachelor's degree.