Utilizando dados para analisar o futebol Europeu

Felipe Mahlmeister
fmeister23-br
Published in
6 min readDec 6, 2019

O Barcelona de Messi é o melhor time de todos os tempos? Quem marca mais gols vence o campeonato?

Vamos responder à essas e outras perguntas fazendo uma análise de um Dataset do futebol Europeu que contém mais de 25.000 partidas que ocorreram entre 2008 a 2016.

Este dataset vai além de dados óbvios como nomes das equipes e do número de gols… ele possui também o nome de todos os jogadores, quais eram suas posições, qual a perna dominante de cada um, qual sua altura, qual seu peso e muitos outros dados interessantes.

Neste estudo iremos focar em encontrar tendências/similaridades dentre as equipes vencedoras e entender um pouco melhor como elas se diferem das equipes intermediárias e mal-sucedidas.

Discutiremos esse assunto como uma análise explanatória, caso você tenha interesse em se aprofundar no código, fique à vontade para conferir minha página do GitHub.

Data Structure

Assim como outros conjuntos de dados mais complexos, esse dataset também possui muitas tables, que podem ser agrupadas para formar uma estrutura de dados relacionais.

Diagrama de Entidade-Relacionamento (ERD) do dataset

Para mantermos um foco neste estudo, vamos nos concentrar em responder nossas perguntas e para isso precisamos apenas dos pontos gerais deste dataset. Portanto, apesar deste dataset ser muito rico em informação, tivemos que filtrar apenas as que nos interessa e assim montamos um grande dataframe com elas.

Depois de lapidarmos a rocha bruta em diamante (limpamos e retiramos valores duplicados), agora temos tudo o que precisamos para respondermos às nossas perguntas.

Análise Exploratória dos Dados

Para iniciarmos esta etapa, porquê não darmos primeiro uma olhada geral e à medida que a gente for se interessando por um determinado assunto vamos nos aprofundando nele? Vamos começar com a seguinte pergunta

Qual temporada teve mais partidas?

A temporada de 2014/2015 foi a que teve mais gols.

Qual será o time que mais venceu nessa temporada?

Qual é o melhor time Europeu de 2014/2015?

O jeito mais fácil de escolher quais foram as melhores equipes seria somando seus pontos do campeonato, que podem ser calculados atribuindo 3 pontos à vitórias, 1 ponto à empates e 0 pontos à derrotas.

Vamos dar uma olhada no top 10 equipes europeias da temporada de 2014/2015.

Top 10 European teams
Top 10 times europeus

Somando todos os pontos nós temos ninguém mais, ninguém menos que o Barcelona como a melhor equipe da temporada 2014/2015, com 30 vitórias, 4 empates e 4 derrotas, terminando o campeonato com extraordinários 94 pontos !

Bom, agora já sabemos quem foram os melhores times desta temporada, porém ainda estou curioso em saber o que realmente importa para ganhar o campeonato… seria o número de gols? Seria um equilíbrio entre ataque e defesa?

Vamos dar uma olhada se o número de gols tem algum impacto nisto

Quem marca mais gols, vence o campeonato?

Que toda equipe tem como objetivo principal ser vitoriosa não é surpresa para ninguém, agora seria correto afirmar que existe uma relação direta entre uma equipe campeã e uma equipe com uma artilharia pesada?

Analisando o gráfico, podemos ver um padrão: quem terminou em primeiro lugar geralmente foi o time que fez mais gols (9 dentre as 11 ligas europeias).

Então podemos sim afirmar que há sim uma forte relação entre ser um time artilheiro e um time campeão!

Se por um acaso você é dono de um time de futebol e está lendo esta matéria (rs), não perca mais tempo… vá agora colocar sua equipe da forma mais ofensiva possível !

Uma coisa que este gráfico não mostra: Qual é o setor mais importante para investir o dinheiro (atacantes, meio-campo, laterais, etc). Para termos esta resposta a gente precisaria de uma análise mais aprofundada deste tópico.

Qual liga marcou mais gols em 2014/2015?

Aprofundando o assunto “gols”, já vimos que é importante ter uma equipe ofensiva para vencer o campeonato, mas nem todas ligas são iguais… algumas delas são mais fáceis de marcar gol do que outras, certo? Podemos dar uma pincelada neste assunto observando a média de gols de cada liga.

Dando uma olhada para os dois últimos gráficos, podemos concluir algumas coisas:

  • Como os dois principais times da liga espanhola marcaram muito mais gols que qualquer outro time Europeu, e esta liga mostrou ter uma das médias de gols mais baixas da europa, podemos concluir que a liga espanhola é a liga Européia mais desequilibrada.
  • A liga Holandesa possui uma média impressionante de 1.54 gols por jogo e suas 3 principais equipes foram umas das que mais marcaram gols nesta temporada de 2014/2015, classificando a Liga Holandesa como a mais ofensiva de todas !
  • Não é mera coincidéncia o PSV aparecer como o 4° melhor time desta temporada, este time possui além de um esquema tático extremamente ofensivo, possui também provavelmente um dos times mais valiosos da europa ! Investimento forte o bastante não só para ganhar seu campeonato nacional (que por sinal conseguiram sem grande esforço, olhando pelo grande gap entre eles e o segundo colocado), mas para ganhar outras ligas européias importantes, como a Champions League e o Campeonato Mundial de Clubes da FIFA.

Conclusão

Neste estudo analisamos:

  • Qual temporada teve mais partidas
  • Qual é o melhor time Europeu de 2014/2015?
  • Se quem marca mais gols, vence o campeonato
  • Qual liga marcou mais gols em 2014/2015

Foi possível observar que existe uma relação entre o total de gols marcados por uma equipe e sua posição no campeonato, porém com o que sabemos até então não é possível categorizar esta relação (forte, média ou fraca) ou até mensurá-la, porque este tipo de questão vai além do que nos propomos a estudar neste artigo.

“Será que o Barcelona e Real Madrid eram realmente bons, ou estavam apenas jogando em uma liga fraca?”

Também pudemos ver que as “melhores equipes” de 2014/2015 (Barcelona e Real Madrid) também eram as equipes que estavam nas ligas mais desequilibradas de todas, levantando a seguinte questão “Será que estas equipes eram realmente boas, ou estavam apenas jogando em uma liga fraca?”. Esta questão pode ser posta à prova colocando as melhores equipes europeias em uma grande liga (Liga dos Campeões), e ver se estas equipes conseguem se destacar.

Na visão geral, este projeto se concentrou na análise geral e não tinha a intenção de buscar detalhes de todas as perguntas. Essa análise mais profunda pode ser feita em outro projeto e, como sugestão, os principais tópicos que podem ser abordados são:

No geral, este artigo se concentrou em uma análise generalista e não tinha a pretenção de responder à todas as perguntas que surgiram. Uma análise mais detalhada poderá ser feita em outro projeto, e como sugestão, alguns tópicos que poderiam ser abordados:

  • Procurar (e mensurar) uma relação entre o saldo de gols com sua colocação no campeonato
  • Construir um modelo preditivo dos jogos, baseando-se nas variáveis disponibilizadas para nós e em sequência testar a confiabilidade deste modelo com dados mais atuais

Se você ficou empacado ou com alguma dúvida em algum ponto ou conceito, fique à vontade para entrar em contato em qualquer rede social, farei o meu melhor para te ajudar

Boa sorte em seus projetos !

Abraços

--

--