Cartola PFC — Analisando jogadores de defesa com Affinity Propagation [Parte III]

Henrique Gomide
Oct 9 · 6 min read

Direto ao ponto. Vamos analisar jogadores de defesa do Cartola FC dando sequência a apresentação da técnica e análise dos atacantes e a [análise dos meias]. Os dados são obtidos da sempre atualizada base de dados com as médias acumuladas no repositório caRtola.

De maneira geral, seguiremos os seguintes procedimentos para análise dos dados: 1) limpeza dos dados; 2) escalonamento multidimensional e 3) affinity propagation.

Uma breve descrição do banco de dados. Temos apelido, código do time, e as médias acumuladas para quase todos os scouts do Cartola FC. Além disso, temos a média acumulada em casa/fora, a diferença entre as médias casa/fora padronizadas (diff_home_away_s), número de jogos na temporada entre outros.

Antes de iniciar de aplicar as técnicas de agrupamento, vamos preparar um pouco o banco de dados para conduzir as análises. A limpeza inclui: selecionar jogadores por posição com um mínimo de jogos. Em algumas posições tiraremos jogadores que possuem média baixa na temporada. Neste tutorial eu omiti o código do R. Você pode encontrar tudo aqui.

Goleiros

Esta análise de correlação pode nos ajudar a começar a entender quais atributos estão mais associados ao desempenho dos goleiros. Defesas difíceis devem ser olhadas para escalar goleiros. Estão correlacionadas de maneira moderada com o a média acumulada de pontos. Não parece haver diferença entre pontuação médias dentro e fora quando descontado o saldo de gols.

Matriz de correlação com atributos dos goleiros.

Esta análise de correlação pode nos ajudar a começar a entender quais atributos estão mais associados ao desempenho dos goleiros. Defesas difíceis devem ser olhadas para escalar goleiros. Estão correlacionadas de maneira moderada com o a média acumulada de pontos. Não parece haver diferença entre pontuação médias dentro e fora quando descontado o saldo de gols.

Agrupamentos dos goleiros

Ao analisar a figura acima, que os goleiros podem ser agrupados em 5 clusters. No cluster azul escuro temos Éverson, Victor, Felipe Alves e Diego Alves, goleiros que têm como característica médias fora de casa melhores que dentro de casa. Embora Diego Alves possua média de pontos melhor que os demais, esta média depende do saldo de gols do Flamengo.

O segundo cluster que merece nossa atenção é o dos goleiros de primeira ordem, que são: Jordi, Douglas Friedrich, Tadeu e Muriel. Eles compartilham algumas métricas em comum tais como boas médias fora de casa. Também são goleiros que apresentam médias maiores de defesas difíceis e portanto médias quando descontados os saldo de gols. Jordi se desgarra do grupo por ser único goleiro que possui média em casa maior que fora de casa.

Comparação das médias dos goleiros

Laterais

Hora de analisar laterais e tentar achar padrões para maximizarmos retorno sobre investimento. Vamos começar com uma matriz de correlação para facilitar nossa interpretação.

Matriz de correlação com atributos dos laterais.

Diferente dos meias, em que vimos que roubadas de bola não apresentam valor para a pontuação final (no caso dos meias, estão associadas as faltas), médias de roubadas de bola estão associadas com pontuações para os laterais. Além disso, chutes a gol podem e dever ser observados na escolha deste tipo de jogadores. Novamente, conseguimos perceber que o fator mando de campo influencia a pontuação sem saldo de gols.

Agrupamentos dos laterais

Temos quatro agrupamentos de laterais. Vamos olhar para o que mais nos interessa, laterais de primeiro escalação, identificados em vermelho (detalhes na figura abaixo). Embora possuam boa pontuação média, este grupo possui jogadores com características distintas. Jorge, o melhor lateral é o cão chupando manga fora de casa; enquanto Moisés apresenta pontuação fora de casa superior do que quando joga em casa. Alguns laterais possuem estatísticas muito semelhantes como Fagner, Diogo Barbosa e Rafael Galhardo, jogadores que dependem de SG para terem a pontuação. Reinaldo e Filipe Luis possuem características muito semelhantes. Já no grupo superior (azul claro), temos jogadores que apresentam médias fora de casa muito maiores do que em casa. No grupo verde, jogadores que não possuem tanta flutuação dentro e fora de casa.

Comparação das médias dos goleiros

Zagueiros

Pronto. Chegou a hora de analisar os defensores. Seguiremos com o mesmo código e analisaremos a matriz de correlação. Vamos começar com uma matriz de correlação para facilitar nossa interpretação.

Matriz de correlação com atributos dos zagueiros.

Não há grande surpresa na escalação dos zagueiros. Pontuações, desconsiderando o saldo de gols, estão associadas fortemente com roubadas de bola e com a pontuação dentro de casa. Outra curiosidade é o fato da média de gols estar muito mais associada do que com os laterais.

Agrupamentos dos zagueiros

Geromito e o resto. Não entrarei em detalhes sobre o Geromito. Vamos falar dos mortais apenas. No primeiro agrupamento mais a direita (em azul piscina), temos Dedé, Rafael Vaz e Cuesta. Victor Cuesta e Rafael Vaz apresentam médias em casa e fora muito semelhantes, enquanto o pobre Dedé apresenta resultados melhores dentro de casa. Pablo Marí e Kannemann são os jogadores que mais representam as características do grupo verde, que apresenta médias superiores fora de casa do que quando mandantes. Veja a figura abaixo para maiores detalhes.

Comparação das médias dos zagueiros

Conclusões

Vamos as conclusões. Conseguimos através da análise de agrupamentos identificar jogadores de defesa com características semelhantes, o que pode ser útil na escalação.

Quanto aos goleiros, percebemos que o processo de escalação deve envolver a análise das médias de defesas difíceis e da análise das chances de saldo de gols. Num futuro tutorial iremos analisar o impacto de um determinado goleiro enfrentar times que chutam muito a gol.

Quanto aos laterais, conseguimos também classificar os grupos com maior média e que possuem diferenças entre ter desempenho em casa e fora. A média acumulada de roubada de bola também precisa ser olhada — não se esqueça de escolher aqueles que também têm alguma chance de fazer gols e assistências.

Por fim, mas não por último, temos os zagueiros. Percebemos que Pedro Geromel está acima do bem e do mal e há grupos distintos de zagueiros; alguns caseiros e outros que jogam melhor fora de casa. Saber destes detalhes pode ser útil para tomar decisões para escalar os jogadores.

Quer ter acesso a estas análises durante todo o campeonato?

Mande um e-mail para: cartolapfclube@gmail.com

H.G.

Vamos as conclusões. Conseguimos através da análise de agrupamentos identificar jogadores de defesa com características semelhantes, o que pode ser útil na escalação. Quanto aos goleiros, percebemos que o processo de escalação deve envolver a análise das médias de defesas difíceis e da análise das chances de saldo de gols. Num futuro tutorial iremos analisar o impacto de um determinado goleiro enfrentar times que chutam muito a gol. Quanto aos laterais, conseguimos também classificar os grupos com maior média e que possuem diferenças entre ter desempenho em casa e fora. A média acumulada de roubada de bola também precisa ser olhada — não se esqueça de escolher aqueles que também têm alguma chance de fazer gols e assistências. Por fim, mas não por último, temos os zagueiros. Percebemos que Pedro Geromel está acima do bem e do mal e há grupos distintos de zagueiros; alguns caseiros e outros que jogam melhor fora de casa. Saber destes detalhes pode ser útil para tomar decisões para escalar os jogadores. Quer ter acesso a estas análises durante todo o campeonato? Mande um e-mail para: cartolapfclube@gmail.com H.G.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade