Inteligência Artificial simula resultados da Copa do Mundo

CRISLÂNIO MACÊDO
Datarisk.io
Published in
8 min readDec 9, 2022

Entenda como os dados podem ajudar na predição dos vencedores dos jogos na Copa do Mundo

Por Andre Ulisses, Crislanio Macedo, Gabriel Bueno, Gabriel Miranda, Rodrigo Pasqualucci e Vitor Monteiro

Fonte: /https://thinkml.ai/artificial-intelligence-ai-in-football-soccer/

Breve histórico

Para os fãs de futebol, o evento esportivo mais esperado é, sem dúvida nenhuma, a Copa do Mundo. Organizada pela FIFA, Federação Internacional de Futebol, a cada quatro anos, o torneio reúne as 32 melhores seleções do mundo, dividida em 2 fases principais: a fase de grupos onde apenas as duas melhores equipes de cada grupo se classificam, e a fase de “mata-mata”, dividida em oitavas, quartas, semi, e a grande final.

A primeira Copa do Mundo aconteceu no ano de 1930, e teve como país sede o Uruguai, após inúmeras tentativas frustradas de se organizar um torneio mundial de futebol. Graças ao surgimento da FIFA e sua intensa “luta” na popularização e profissionalismo do futebol, o evento passou a fazer parte do calendário mundial.

Com o decorrer dos anos e a propagação do futebol em todos os cantos do mundo, a importância da Copa do Mundo refletiu-se também nos gramados com o aumento do número de seleções que disputam o “caneco”. Para se ter uma ideia, as edições de 1934, 1938 e 1950, continham 16, 15 e 13 nações, respectivamente. Os anos de 1954 a 1978 contavam com apenas 16 participantes, até que em 1982 foi ampliado para 24 times, até a Copa do Mundo de 1994 nos Estados Unidos (país sede). O modelo atual, com 32 equipes, foi usado pela primeira vez na Copa de 1998 e permanecerá desta forma até 2022. A partir de 2026, teremos 48 seleções mundiais na disputa, ampliando ainda mais a grandiosidade do evento.

Atualmente, a seleção brasileira lidera, com cinco títulos mundiais, seguido por Alemanha e Itália, ambas com quatro. Agora são 12 títulos da Europa contra nove da América do Sul.

Fonte: https://ge.globo.com/futebol/copa-do-mundo/

Inteligência artificial e o mundo do futebol

A Inteligência Artificial (I.A) veio para ficar. A tecnologia também está sendo empregada no futebol para desenvolver e modernizar a modalidade. A I.A invadiu de vez as “quatro linhas” e se tornou peça importante para clubes em todo o mundo e já faz parte do dia a dia das equipes.

O uso de dados na rotina esportiva já é uma realidade. Não é à toa que muitas equipes de futebol utilizam a tecnologia em seus departamentos para análises de desempenho, relatórios físicos e técnicos dos atletas, captação de atletas jovens promissores e avaliações de possíveis contratações. Os dados são coletados durante uma partida para estudos estatísticos posteriormente. Tais análises auxiliam a comissão técnica do time a avaliar o desempenho da equipe como um todo, seja na parte ofensiva ou seja na defensiva, além de medir os scouts (performance) individuais dos atletas, permitindo até evitar lesões por excesso de esforço físico.

“…Cientista de dados do Internacional, o executivo Eduardo Seligman cita que as informações obtidas pelo uso da tecnologia são fundamentais nas tomadas de decisão da diretoria e comissão técnica. “Aqui no Inter, e em outras equipes também, muitas das informações que obtemos são geradas através de algoritmos e automatização. São dados que impactam em aspectos como captação de atletas, observação e análises de desempenho”, explica Seligman…” (Fonte: https://esportes.r7.com/futebol/inteligencia-artificial-invade-futebol-e-vira-peca-importante-para-clubes-17052022)

A FIFA, entidade máxima do futebol mundial, também se rendeu ao recurso tecnológico, inclusive anunciou recentemente que utilizará I.A para aperfeiçoar o desempenho do VAR (Video Assistant Referee) nas partidas. O intuito principal é tornar as decisões dos árbitros de campo mais ágeis e precisas, hoje alvo de muitas críticas, especialmente no Brasil. A entidade publicou em seu site oficial, o aplicativo “Fifa Player App” que possibilitará aos jogadores obter informações sobre seu desempenho em campo logo após cada partida.

Fonte: https://apkpure.com/fifa-player-performance-app/com.fifa.player

Modelo de Machine Learning

Vamos apresentar o processo de criação da inteligência para simular o campeão da Copa do Mundo da Fifa. Podemos dividir o processo de criação de um modelo de machine learning em 3 etapas: coleta de dados, preparação dos dados, criação do modelo final otimizado.

A etapa de coleta consistiu em reunir as informações para tomada de decisão da I.A com o objetivo de solucionar o problema. O objetivo é prever resultados de partidas de futebol, nesse cenário temos 3 possibilidades: vitória, empate ou derrota. Para auxiliar na tarefa, coletamos informações sobre as equipes, tais como: histórico de partidas, partidas de eliminatórias para a Copa e competições continentais e amistosos, referentes aos 4 anos anteriores à Copa e o ranking de seleções da FIFA das Copas de 2022, 2018 e eliminatórias de 2022 e 2018. Para prever os resultados da Copa do Mundo deste ano, utilizamos a Copa de 2018 para treinar o modelo. Para cada seleção da Copa de 2018 e de 2022, foram coletadas informações dos últimos 10 jogos antes de ambos os torneios. As informações coletadas foram: o resultado (gols marcados e sofridos), posse de bola, finalizações, finalizações sofridas, finalizações no gol, finalizações no gol sofridas, faltas cometidas e faltas sofridas.

Posteriormente, foi realizada a preparação dos dados. Realizamos a limpeza dos mesmos, isto é, tratamento de missing, validação das informações, além da criação de variáveis, que é uma etapa crucial, pois ajuda no ganho de informação para a I.A, para que o modelo tome decisões mais assertivas. Algumas variáveis foram criadas utilizando gols marcados e calculando estatísticas como: soma, média, mediana e desvio padrão dos últimos 10, 5 e 3 jogos. O mesmo cálculo estatístico de soma, média, mediana, desvio padrão e coeficiente de variação dos últimos 3, 5 e 10 jogos, foi realizado para outras variáveis, como: gols sofridos, posse de bola, finalizações, finalizações sofridas, finalizações no gol, entre outras. Dando origem a novas variáveis como por exemplo: chutes_para_marcar, que é calculado através da razão entre finalizações e gols marcados. De forma análoga, foram criadas as variáveis: chutes_certos_para_marcar, chutes_recebidos_para_gols_sofridos e chutes_certos_recebidos_para_gols_sofridos, e porcentagem_chutes_certos, que é a razão entre finalizações certas e finalizações. Calculamos diferentes estatísticas em janelas de 3, 5 e 10 últimos jogos, resultando, assim, em variáveis como por exemplo: porcentagem_chutes_certos_mediana_10, que representa a mediana da razão entre finalizações certas e finalizações nas últimas 10 partidas. Através das informações de partidas anteriores a Copa, foi calculado: a pontuação média, média de gols marcados e média de gols sofridos. Essas variáveis, juntamente com o Ranking da FIFA e nome da equipe, foram as variáveis explicativas usadas no treinamento do modelo. Ao final da etapa de processamento das informações chegamos a aproximadamente 250 variáveis.

Na etapa de modelagem, a Copa de 2018 foi utilizada para treinamento da I.A. A etapa de criação do modelo final otimizado consistiu em realizar uma bateria de experimentos até a sua criação. Optamos por uma abordagem de classificação, o modelo final foi o catboost. As informações mais relevantes para o modelo construído foram: a informação dos nomes das seleções, gols sofridos, gols feitos e o rankeamento. Para mitigar o viés nos confrontos fora/casa foram simulados os resultados para os confrontos de cada seleção jogando em casa/fora, para os locais em que o fator campo (jogar em casa) não existia.

Abaixo temos um exemplo de tratamento de duplicidade dos dados e de predição do modelo.

exemplo das informações para predição
exemplo de predição do modelo

Depois da simulação de cada confronto na fase de grupos e em cada fase da Copa, chegamos a grande final entre Brasil x Bélgica. A pontuação de cada fase de grupo e chaveamento do campeonato é mostrado abaixo.

pontuação dos grupos na Copa
simulação dos resultados da Copa pela I.A fonte simulador: https://interativos.ge.globo.com/futebol/copa-do-mundo/especial/simulador-da-copa-do-mundo-2022

Mata-Mata da Copa

Após a definição da Copa do Mundo, temos os classificados em cada grupo. A I.A acertou as 2 seleções classificadas para o grupo A, 1 seleção do grupo B, 1 seleção do grupo C, 1 seleção do grupo D, 2 seleções do grupo E, 1 seleção do grupo F, 2 seleções do grupo G e 1 seleção do grupo H. O modelo acertou 6 dos 8 confrontos das oitavas de final, fizemos uma nova simulação das quartas, semi e da grande final.

simulação dos resultados da fase das quartas de final pela I.A

A I.A determinou a Argentina favorita contra a Holanda, o confronto entre Croácia x Brasil deu a vitória ao Brasil. Já no jogo entre França x Inglaterra, temos a França como favorita e temos um empate entre Portugal x Marrocos, com Portugal se classificando.

A I.A acertou 3 confrontos na fase das quartas de final. Após a confirmação das quartas de final fizemos uma nova simulação. A I.A determinou a Croácia favorita contra a Argentina e a França favorita contra Marrocos.

simulação do resultado da Copa pela I.A — semifinal

Após a confirmação da final da Copa fizemos uma nova simulação. Na grande final temos um confronto entre Argentina x França e o confronto do 3° colocado e 4° colocado é entre Croácia x Marrocos.

simulação dos resultados da Copa pela I.A — 3° lugar e 4° lugar, final
simulação dos resultados da Copa pela I.A após resultado das quartas de final. Fonte do simulador:https://interativos.ge.globo.com/futebol/copa-do-mundo/especial/simulador-da-copa-do-mundo-2022

Conclusões

Neste artigo foi apresentado, de maneira geral, como a Inteligência Artificial pode ser utilizada para simular os confrontos na fase de grupos e mata-mata na Copa do Mundo. Foi apresentada uma simulação dos jogos entre as seleções, demonstrando como seria o resultado da I.A. O objetivo do estudo foi mostrar que existem inúmeras abordagens para gerar previsões dos resultados dos confrontos na Copa do Mundo, buscamos uma abordagem simples.

Na Datarisk solucionamos problemas com o uso de Inteligência Artificial e Machine Learning. Se quiser conhecer mais sobre nós, visite nosso site e redes sociais: Instagram, Linkedin e Youtube.

Bibliografia:

https://brasilescola.uol.com.br/educacao-fisica/copa-mundo.htm

https://www.correiobraziliense.com.br/esportes/2022/09/5038917-fifa-desenvolve-app-de-dados-para-jogadores-durante-a-copa-do-mundo-2022.html

https://www.fifa.com/fifaplus/en/tournaments/mens/worldcup/qatar2022

https://www.oliberal.com/esportes/copa-do-mundo/taca-da-copa-do-mundo-2022-vai-mudar-entenda-quando-e-porque-1.501451

https://www.qatar2022.qa/

https://esportes.r7.com/futebol/inteligencia-artificial-invade-futebol-e-vira-peca-importante-para-clubes-17052022

--

--