Um ano de dados + futebol + apostas

Tiago Augusto Ferreira
Academia dos Bots
Published in
3 min readJul 29, 2022

Olá, pessoal!

A ideia de hoje é trazer um resumo de tudo o que já aprendi neste um ano em que comecei este novo projeto que foi unir algumas coisas que gosto muito: dados, futebol e dinheiro (heheh). O interessante desta caminhada é observar o como pude aproveitar os aprendizados no dia a dia profissional.

Em resumo, se você está em busca de algum projeto desafiador, montar modelos/análises para prever resultados de futebol/apostas (cuidado com as apostas), pode ser um bom caminho.

Abaixo vou listar alguns tópicos e os aprendizados que você pode ter caso queira seguir este caminho.

0 — Cuidado com as apostas

Existe um grande risco envolvendo as apostas. O vício é algo real e muito perigoso. Se sentir que não é pra você, não force. Muito cuidado!!

1 — Engenharia de dados

Assim como no dia a dia de quem trabalha com dados, no futebol você vai encontrar dados em planilhas, em sites, em formatos diversos, com nomes de times despadronizados. Você vai ter um trabalho inicial de coletar, limpar e armazenar estes dados para depois analisá-los. Qual banco de dados usar? Devo utilizar um banco? Cloud ou local? Qual a latência? Qual ferramenta devo usar para extrair os dados? Ter que tomar estas decisões ajudará você a ter uma visão do todo em um projeto de dados. Hoje eu mantenho um pipeline que coleta dados minuto a minuto de mais de 50 campeonatos e construir esta estrutura foi um grande aprendizado.

2 — Análise exploratória e conhecimento de negócio

Antes de começar em qualquer negócio é importantíssimo entender o ecossistema em que ele está inserido. No futebol, conhecer os principais campeonatos do mundo, como é a distribuição dos gols, principais times, etc. me ajudou a exercitar análise exploratória e também a pensar em como aqueles comportamentos observados poderiam gerar ideias para obter lucro (no final das contas, o objetivo final sempre vai ser o lucro).

No campo das apostas, tive que estudar (e ainda estou estudando) os conceitos do mercado, trade, odds, etc. Aqui vali um alerta tem muita gente má intencionada no meio, eu recomendo Théo Borges (https://theoborges.com/) e Nettuno (https://www.faculdadedotradeesportivo.com/) os caras entendem muito e tem didáticas excelentes.

3 — Liberdade para experimentação

Vou rodar uma regressão logística para prever a probabilidade de ter 2 gols em um jogo…rode…vou testar um novo modelo de rede neural estado da arte que vi num paper da Nasa..teste… ter uma estrutura destas te permite testar e colher resultados muito rápidos, afinal de contas tem jogo praticamente todo dia. Eu já testei muita coisa neste tempo e o backlog ainda está grande. Aqui sinto que é onde tenho maior ganho profissional.

4 — Estatística na prática

O mercado de apostas é todo baseado em probabilidades e isto faz com que a gente precise entender e se aprofundar bastante em conceitos de estatística. Lidar com a variância fará parte do seu dia a dia. Conhecer sobre tamanho de amostra, intervalo de confiança vai te livrar dos “grupos de Tips do mal” que pegam uma amostra de 50 greens e vendem como se fosse o método mais lucrativo do mundo. É um bom espaço também para exercitar o conhecimento em estatística Bayesiana.

5 — Converter output em lucro

Neste caminho o grande objetivo é gerar lucro com os outputs e insights obtidos. É preciso entender do mercado e saber como trabalhar com o seu modelo/análise, para que gere lucro (e não é nada fácil, acredite). Este exercício constante te dará muita habilidade para lidar com estes desafios no momento de encarar estes desafios no trabalho.

Ao final de 1 ano, o balanço (de aprendizado, pois o financeiro ainda está ruim..hehehe) tem sido super positivo. Ser lucrativo nas apostas por meio de dados é um big desafio, que demanda tempo e dedicação.

Caso você queira trocar ideia sobre o tema, será um grande prazer compartilhar conhecimento sobre o tema.

Abraços e até a próxima.

Links úteis sobre o tema:

Apostas

Théo Borges: https://theoborges.com/

Nettuno: https://www.faculdadedotradeesportivo.com/

Modelagem

http://www.pena.lt/y/blog.html

https://skepticalsports.com/tag/bayes-theorem/

https://repositorio.unesp.br/bitstream/handle/11449/169672/2-s2.0-85018636158.pdf;jsessionid=03ACC79DD00304D28ADE2E706255BDA0?sequence=1

https://www.programmersought.com/article/12891685679/

https://fse.studenttheses.ub.rug.nl/21917/1/bMATH_2020_BruinsmaR.pdf

https://betfair-datascientists.github.io/modelling/soccerModellingTutorialPython/

https://dashee87.github.io/football/python/predicting-football-results-with-statistical-modelling/

https://jameswgrayson.wordpress.com/2012/12/02/introducing-tsr2-4/

https://statsbomb.com/articles/soccer/goal-expectation-and-efficiency/

https://github.com/dashee87/blogScripts/blob/master/Jupyter/2018-09-13-predicting-football-results-with-statistical-modelling-dixon-coles-and-time-weighting.ipynb

http://danielweitzenfeld.github.io/passtheroc/blog/2014/10/28/bayes-premier-league/

http://gijskoot.nl/bayesian/sports/soccer/predictions/pymc3/2018/02/07/knvb-model.html

https://rlhick.people.wm.edu/stories/bayesian_3.html#

https://bitbucket.org/scisports/ssda-how-to-expected-goals/src/master/notebooks/how-to-expected-goals.ipynb?viewer=nbviewer

Low_latency_multivariate_Bayesian_shrinkage_in_online_experiments_5pages — Simon Ejdemyr.pdf

Tecnologias

https://github.com/betfair-down-under/AwesomeBetfair

--

--