Entendendo a Lei dos Grandes Números: estatística e apostas esportivas

Como o acaso se torna previsível quando os números crescem

Edson Junior
6 min readJan 19, 2024
Fonte: https://igamingbrazil.com/aposta-esportiva/2022/07/19/apostas-esportivas-uma-grande-fonte-de-receita-mal-aproveitada-pelo-governo-brasileiro/

Sumário

→ Introdução
→ Lei Fraca dos Grandes Números
→ Lei Forte dos Grandes Números
→ Exemplo — Por que os apostadores devem conhecer este teorema?
→ Conclusão
→ Referências

Introdução

A Lei dos Grandes Números na verdade equivale a uma família de teoremas que se fundamenta na ideia de que:

A média de uma grande quantidade de experimentos realizados aleatoriamente tende a se aproximar do valor esperado da variável aleatória em questão.

Ou seja, a média de uma amostra tende para a média da população quando o número de observações/dados é muito grande.

A primeira grande versão deste teorema foi elaborada pelo famoso matemático Jakob Bernoulli, sendo chamada de Lei Fraca dos Grandes Números. Anos mais tarde, o também matemático Pafnuty Chebyshev deu continuidade e expandiu o trabalho de Bernoulli, dando origem a Lei Forte dos Grandes Números, que fornece uma garantia maior de convergência da média das observações ao valor esperado. As duas leis serão detalhadas nos próximos tópicos.

Ainda neste artigo, será estudada a relação que esta lei possui com as apostas esportivas, que vêm crescendo significativamente e ocupando grande parte da mídia nos últimos meses. Por que os apostadores devem conhecer este teorema?! Continue a leitura para saber mais!

Lei Fraca dos Grandes Números

Considere um conjunto de variáveis aleatórias denotado por:

Fonte: Próprio autor

Suponha também que estas variáveis aleatórias sejam:

  1. Independentes: Ou seja, o resultado de uma variável não tem influência no resultado de outra variável.
  2. Identicamente distribuídas: estas variáveis aleatórias tem a mesma média e mesmo desvio padrão.

O objetivo de Bernoulli foi estudar o que aconteceria com a média das variáveis aleatórias, indicada abaixo, à medida que se aumentava o número de observações n.

Fonte: Próprio autor

A fim de verificar o quão próxima a média amostral da fórmula anterior se aproxima do valor esperado μ (média populacional) da variável aletória, foi calculada a diferença absoluta (em módulo) entre os termos. Em seguida esta diferença foi comparada com um número positivo e bem pequeno denotado por ε (épsilon).

Fonte: Próprio autor

Por fim, o que fundamenta a Lei Fraca dos Grandes Números é a ideia de que a probabilidade desta diferença ser menor que ε se torna cada vez mais próxima de 1 à medida que o número n de observações se torna infinitamente grande. Em termos de limite, o raciocínio anterior pode ser traduzido para a seguinte expressão:

Fonte: Próprio autor

Ou seja, a Lei Fraca dos Grandes Números se resume à:

Quanto maior o tamanho da amostra, a probabilidade de que a média amostral se desvie da média populacional μ por menos que um valor pequeno ε se aproxima de 1 (100%).

Lei Forte dos Grandes Números

Para a Lei Forte dos Grandes Números, são consideradas as mesmas variáveis aleatórias da formulação da Lei Fraca, incluindo o fato de serem independentes e identicamente distribuídas.

Neste caso, a Lei Forte é fundamentada na ideia de que:

Quanto maior o tamanho da amostra ou quanto mais o número de observações tende ao infinito, mais a probabilidade da média amostral tender ao valor esperado da variável aleatória se aproxima de 1 (100%).

Ou seja, a Lei Forte dá a garantia (ou certeza) de que, com n tendendo ao infinito a média amostral converge para o valor esperado da variável aleatória. O raciocínio pode ser traduzido na seguinte expressão:

Fonte: Próprio autor

Apesar das duas leis tratarem da convergência ao valor esperado, a Lei Forte oferece uma garantia mais FORTE, mais CERTA, mais RIGOROSA de convergência.

Para a Lei Fraca, como há o fator ε envolvido, a média amostral converge para PRÓXIMO do valor esperado, não diretamente para ele. Sendo assim, há uma garantia mais FRACA de que a média amostral se aproxima da média populacional.

Exemplo — Por que os apostadores devem conhecer este teorema?

Suponha que, ao longo dos anos, estudiosos do futebol e da estatística coletaram dados de jogos de futebol no Brasil. Eles descobriram que, em média, há uma probabilidade de 70% de ocorrer pelo menos um gol no primeiro tempo de um jogo. Este valor de 70% é a média esperada com base na análise histórica dos jogos.

Pelo que foi estudado nos tópicos anteriores sobre a Lei dos Grandes Números, à medida que o número de jogos observados aumenta, a proporção real de jogos com pelo menos um gol no primeiro tempo deve se aproximar dessa média esperada de 70%.

Para ilustrar esta situação, será simulada uma série de 50 mil jogos de futebol, onde cada jogo tem 70% de chance de ter um gol no primeiro tempo e 30% não haver nenhum gol, sendo esta informação representada pelo parâmetro p, da função np.random.choice(). Além disso, nesta mesma função, cada jogo com ao menos um gol no primeiro tempo recebe o valor 1 (um), sendo 0 (zero) caso o contrário.

# Importando a biblioteca de manipulação algébrica
import numpy as np
# importando a biblioteca de análise exploratória de dados
import matplotlib.pyplot as plt

# setando a quantidade de jogos simulados
n_jogos = 50000

# Simulando os jogos
# Supondo que 1 representa um jogo com gol no primeiro tempo e 0 caso contrário
jogos = np.random.choice([0, 1], size=n_jogos, p=[0.3, 0.7])

# Obtendo a probabilidade observada de haver ao menos um gol no primeiro tempo
probabilidade_gol = np.cumsum(jogos) / np.arange(1, n_jogos + 1)

Desta forma, pode-se plotar um gráfico que apresenta como a probabilidade observada de um gol no primeiro tempo se aproxima de 70% à medida que o número de jogos simulados aumenta.

# Plotando o resultado
plt.figure(figsize=(12, 8))
plt.plot(probabilidade_gol, color='blue')

# Linha tracejada representando a média esperada de 70%
plt.axhline(y=0.7, color='grey', linestyle='--')

# Configurando o gráfico
plt.title('Lei dos Grandes Números - Probabilidade de gol no primeiro tempo em jogos de futebol')
plt.xlabel('Número de jogos')
plt.ylabel('Probabilidade observada de gol no primeiro tempo')
plt.show()

O que gera o gráfico a seguir:

Fonte: Próprio autor

Pelo gráfico acima, inicialmente a probabilidade varia significativamente, mas à medida que o número de jogos aumenta, a linha começa a se estabilizar e se aproximar da linha cinza tracejada, que indica a probabilidade esperada de 70%.

Que lição os apostadores podem tirar?

  • Nas primeiras apostas: no início, o resultado pode variar significativamente, como mostra o gráfico. O apostador pode ter sorte e ganhar a maioria de suas apostas ou ter uma série de perdas. São flutuaçõesnormais devido ao pequeno número de apostas. A curto prazo, o resultado é fortemente influenciado pelo acaso.
  • Com muitas apostas: aqui o apostador começa a apostar continuamente durante vários jogos seguidos. Com mais apostas, a proporção de gols no primeiro tempo tende a se aproximar da probabilidade teórica de 70%.

Ou seja, “Neste caso, jogou uma vez e não deu certo?! Jogue mais vezes!”

Conclusão

Apostas esportivas estão em alta, lembre-se da Lei dos Grandes Números, os resultados a curto prazo podem ser enganosos. A longo prazo, a sorte do apostador tende a se equilibrar, e os resultados se alinham mais fortemente às probabilidades teóricas. Isso é fundamental para as estratégias de apostadores.

Ainda não me segue no Medium? Aproveite e me siga para ficar sabendo toda vez que sair um artigo novo do forninho!!

LinkedIn: https://www.linkedin.com/in/edson-junior/

GitHub: https://github.com/ejunior029

Referências

  1. Canal do YouTube da UNIVESP
  2. Canal do YouTube da Khan Academy Brasil
  3. Teoremas Limites — UFSC — Disponível em: https://www.inf.ufsc.br/~andre.zibetti/probabilidade/teoremas-limite.html

--

--