Argentina y España, ¿Son justos campeones? ¿Qué equipos performaron mejor según la ciencia de datos?

Manu Duran
Data & AI Accenture Argentina
8 min readJul 16, 2024

En las últimas semanas, el mundo se vió envuelto en dos de las más grandes competiciones continentales que el fútbol puede brindar: la Eurocopa y la Copa América. El último 14 de julio, España y Argentina (que sigue de fiesta) se consagraron campeones respectivamente y los fanáticos de la ciencia de datos no podíamos dejar de preguntarnos si los modelos de Inteligencia Artificial indican que estos fueron los justos campeones.

En el deporte es muy difícil hablar de merecimientos. ¿Cómo se le explica a un fanático del fútbol que su equipo mereció ganar la final a pesar de haberla perdido? ¿Realmente sirve de consuelo? Muchas veces se habla de que “El equipo X jugó mejor que el equipo Y” pero sin mucho sustento estadístico. Sin embargo, si uno lo piensa, en deportes como el basquet donde pueden haber más de 200 puntos por partido es más probable que el equipo que jugó mejor se lleve el partido. En cambio en el fútbol, un juego donde se puede definir con 1 o 2 goles por partido, la suerte puede jugar un rol fundamental y el que “jugó mejor” no ser el ganador del partido, porque una sola jugada cambió todo. Es por esto que vale la pena hacer este análisis para entender realmente si los campeones fueron justos ganadores o no y existe una métrica en el mundo del fútbol que surge con la ciencia de datos que puede ayudar a determinarlo.

¿Qué es el xG (Expected Goal) y cómo se puede utilizar para evaluar la performance de los equipos a lo largo de un torneo?

El Expected Goals (xG) es una métrica que se genera a partir de un modelo de Machine Learning que estima la probabilidad de que un tiro/disparo termine en gol, basándose en una serie de factores contextuales. Entre estos, se consideran:

  • La posición en la cancha desde donde se patea (incluyendo la distancia y el ángulo del tiro).
  • Cantidad de jugadores que se tiene en frente.
  • Parte del cuerpo con la que se dispara (cabeza, pie hábil, etc).
  • Situación de juego (pelota parada, de volea, etc).

En esencia, se entrena un modelo de inteligencia artificial con cientos de miles de disparos históricos (que terminaron en gol o no) y se asigna un valor numérico a cada oportunidad, que refleja la probabilidad de que dicha situación termine en la red (siendo valores cercanos a 0 disparos de bajo peligro y los cercanos a 1, alta probabilidad de que terminen en gol). A esto se lo conoce como el xG. Veamos un ejemplo simple a partir del mapa de tiros de la Selección Argentina en la final de la Copa América.

Mapa de tiros de Argentina vs Colombia — Final Copa América 2024

Considerando el total de tiros durante el partido (mayor el tamaño de burbuja, mayor el xG del disparo), Argentina acumuló un xG = 1.04 (la simple suma del expected Goal de los distintos disparos que tuvo a lo largo del partido). Si uno analiza el número acumulado, indica que Argentina, estadísticamente, mereció convertir casi un gol en el partido, que fue lo que terminó ocurriendo.
Disclaimer: No siempre se dan valores cercanos a lo esperado.

¿Por qué es importante el xG? La idea es simple. Muchas veces se analiza superficialmente la cantidad de disparos al arco que tuvo cada equipo para ver quién jugó mejor. Pero…. ¿todas las llegadas generan el mismo peligro? A diferencia del simple conteo de tiros al arco, el xG nos proporciona una medida de la calidad de las oportunidades creadas y concedidas por un equipo. Esto permite evaluar el rendimiento de manera más precisa, ya que un equipo que genera muchas oportunidades de alta calidad (alto xG) puede estar jugando mejor que un equipo que anota goles con pocas oportunidades (bajo xG). Así, dicha métrica nos ayuda a entender mejor el merecimiento de los equipos a lo largo de un partido o de un torneo. Un claro ejemplo es la misma final de la Copa América donde Colombia acumuló 19 disparos y Argentina 11, sin embargo Argentina terminó por encima (levemente) en el xG acumulado (1.04 de Argentina vs 0.99 de Colombia) en un partido parejo que podría haber sido para cualquiera.

De esta forma, uno puede evaluar el rendimiento de un equipo a lo largo de la competición. Por ejemplo se puede observar fácilmente el mapa de tiros de las 3 selecciones de la Copa América que ocuparon el podio.

Mapa de tiros del top 3 de selecciones de la Copa América

Ahora si… Algunas estadísticas a lo largo de las competiciones.
¿Cuáles fueron las selecciones que más xG generaron y las que menos xG en contra acumularon?

Ya que se tiene un mejor contexto de la métrica, se podrá hacer un análisis más interesante de las selecciones que mejor jugaron ambas copas, siendo estos los que más xG acumularon a favor y menos xG acumularon en su contra (xG acumulado de los rivales) a lo largo de la competición.

Por ejemplo uno puede observar rápidamente en la copa América el rendimiento por selección al ver el Dif. xG = (xG a favor — xG en contra) que es un gran indicador para mostrar la performance del equipo en el torneo. Basicamente cuanto más alta la métrica, más situaciones de peligro generó tu equipo y, a su vez, menos tu rival.

Rendimiendo de las selecciones de la Copa América por Dif. xG

Rápidamente se puede observar que, ordenando la tabla por dicha métrica de mayor a menor, el podio en la tabla Dif. xG es exactamente igual al podio real de la copa (1ero Argentina, 2da Colombia, 3era Uruguay), mientras que el 4to equipo de la copa, Canadá, parece ser que performó “mejor de lo esperado” dado que se encuentra 8avo en la tabla. Interesante también observar que paises como México y Brasil terminaron por encima en la tabla cuando por ejemplo la tricolor no pudo siquiera pasar de fase de grupos (un claro ejemplo de un equipo que tendría que haber tenido mejores resultados).

Ahora… ¿Qué pasó en la Eurocopa? Mucho se habló del rendimiento de países favoritos como Inglaterra que era uno de los candidatos, a priori, a ganar la copa. El equipo Inglés llegó a la final pero aún así fue muy criticado durante el mes de la competición por sus malos desempeños.

Rendimiendo de las selecciones de la Eurocopa por Dif. xG

Los números nuevamente lo respaldan. Entre los paises que llegaron a fase final de la Eurocopa, España lidera la tabla y en el 2do puesto aparece Alemania (no Inglaterra). Los ingleses se encuentran recién en el puesto nueve demostrando que si bien encontraron el camino a la final, las críticas parecen tener sentido.

Pero… ¿Qué pasa si vamos un paso más allá y simulamos los partidos de la copa?

A nivel general, observando las tablas, los resultados parecen tener sentido (¡ambos campeones lideran las tablas!). Sin embargo, alguien podrá decir que hay partidos que pueden sesgar estas métricas globales. Rápidamente uno puede pensar en Colombia (5) — Panamá (0) de la Copa América o Alemania (5) — Escocia (1) en el partido inaugural de la Eurocopa, donde los paises pueden subir su métrica total por un buen partido.

Para evitar estos sesgos, uno puede analizar el partido a partido de la competición trabajando con el xG, una métrica probabilistica. Por ejemplo, un disparo de xG = 0.35 nos dice que el tiro tiene un 35% de chances de terminar en gol, o lo que es lo mismo, de cada 100 veces que Lautaro Martinez realiza ese mismo tiro, 35 terminarán en gol. Bajo esta definición, uno puede simular los partidos N veces (por ejemplo, 1000 veces) con todas las jugadas que generó un equipo y su rival (con sus respectivos xG) y entender de cada 100 partidos (o 1000, o 1 M) cuantos tendría que haber ganado el equipo X y en cuantos el equipo Y. Este análisis estadístico podrá dar una mejor idea de los merecimientos que se mencionaron al principio del artículo.

Algunos de los resultados más interesantes de las simulaciones

Tras realizar 100.000 simulaciones tanto para la Eurocopa como la Copa América, hay algunos datos de rendimientos interesantes. Se puede observar que los resultados de la fase inicial de la Copa América para algunos grupos (A y D) son casi iguales, teniendo los mismos 1eros y 2dos que realmente se obtuvieron (Argentina y Canadá, Colombia y Brasil). Sin embargo, para los grupos B y C, los rendimientos de paises como México y USA indican que deberían haber tenido mejor suerte (¿O acaso mejor definición?) para pasar a la fase eliminatoria final (incluso México como 1era del grupo), lo cuál es coherente a la tabla previa donde el Tri se ubicaba 4to en el ranking general de Dif. xG.

Resultados de las posiciones de los grupos tras 100.000 simulaciones

Por último si observamos el camino a la final de los finalistas de ambas competiciones, partido a partido, se pueden obtener algunos datos curiosos más.

Argentina tuvo un partido igualado vs Ecuador donde fue levemente inferior mientras que Colombia tuvo mejores rendimientos en 4tos de final y semifinales. En la final, como se vió el ejemplo previamente, el partido fue parejo con una leve ventaja para el equipo albiceleste.

Probabilidad de victoria partido a partido de camino al título

En cuanto al camino en fase eliminatoria para los finalistas de la Eurocopa, algunos resultados terminan siendo interesantes. España fue ampliamente superior a Inglaterra y mereció ganar la final, sin embargo, en 4tos y semifinales tuvo un rendimiento por debajo de sus rivales (Alemania y Francia respectivamente). Inglaterra, como se mencionó previamente, no tuvo el mejor desempeño siendo ampliamente inferior tanto en octavos como en la final y teniendo un partido parejo vs Suiza en los 4tos de final.

Probabilidad de victoria partido a partido de camino al título

Conclusiones

Si bien el fútbol es un deporte con infinitas variantes que influyen en el resultado final, estas métricas que surgen de modelos de Inteligencia Artificial permiten entender mejor el contexto y rendimientos a largo plazo de los equipos durante toda la competición. La métrica de Expected Goals (xG) es especialmente útil para comparar los resultados reales con los resultados esperados, proporcionando una visión más profunda sobre la performance de los equipos en la Eurocopa y la Copa América.

Por ejemplo, podemos evaluar el rendimiento eficaz de los equipos. Si un equipo tiene goles reales anotados mayores que el xG acumulado, significa que fue más eficaz que el promedio al convertir sus oportunidades en goles. Por otro lado, si un equipo tiene goles reales anotados menor que el xG acumulado, podemos concluir que el equipo tuvo mala suerte o una pobre definición en sus oportunidades de gol, sugiriendo que debería haber obtenido mejores resultados de acuerdo con las oportunidades creadas.

Bajo esta premisa, Argentina y España, a lo largo del torneo, tuvieron rendimientos por encima del resto de las selecciones y si bien no merecieron ganar todos los partidos holgadamente, mostraron ser de los equipos más consistentes en su camino al título.

--

--