ACTUALIDAD DE LA PREDICCIÓN DEPORTIVA CON MINERÍA DE DATOS

Jonathan Malaver
Nov 4 · 5 min read

Estábamos como de costumbre con un amigo, buscando los mejores partidos para apostar en la liga de campeones, se jugaba una fecha más de la fase de grupos. Algunas veces conseguimos esos soñados parlays ganadores pero en la mayoría de los casos, nos pasa que perdemos por uno de esos partidos en los que pasan cosas inexplicables, un título no puede ganar un pequeño equipo. Pero ya sea por ganar algún dinero extra o por la simple emoción de adivinar un resultado, alguna vez volvemos a intentar armar un parlay ganador, ahhh pero la siguiente vez, con más análisis previo y pensando en qué otra estrategia podemos usar para ganar.

Actualmente realizamos un posgrado enfocado en bases de datos, y para ciertas asignaturas se nos solicitó investigar cualquier tema relacionado con las bases de datos, así que decidimos adentrarnos en el mundo de la minería de datos. Tras leer y leer sobre las tantas aplicaciones que tiene la minería de datos, llegamos a la idea: ¿por qué no investigar si alguien ha aplicado antes la minería de datos para predecir resultados deportivos? Y así decidimos ver si alguien tenía algo que aportar a nuestras predicciones.

Nos dimos a la tarea de buscar investigaciones, estudios, tesis, todo lo que implica usar minería de datos para predecir resultados deportivos.

Contextualizando, la minería de datos es un campo de la estadística y las ciencias de la computación que permite encontrar patrones en grandes cantidades de datos. Básicamente, la minería busca obtener información valiosa del análisis de datos para usarla en la toma de decisiones. Existen muchas técnicas de minería de datos con sus propios procesos para aplicarlas.

Volviendo a nuestra historia ...

¿Qué encontramos?

29 investigaciones que tenían lo que buscábamos: Predecir resultados deportivos usando técnicas de minería de datos que muestran la posibilidad alcanzada en cuentos predicciones.

Teniendo ya nuestra sólida base documental, empezamos con caracterizarlas una a una extrayendo la siguiente información:

  1. Deporte al que se aplicó la predicción: Queríamos verlo eran los deportes más analizados en esta área.
  2. Técnica de minería con la eficacia más alta de acuerdo a los resultados mostrados en cada una: Queríamos aprender el funcionamiento de las técnicas de minería que se trabaja en las investigaciones y ver los mejores resultados en cada deporte.

Nuestro primer hallazgo se muestra en la siguiente tabla:

Como lo esperábamos, aproximadamente la mitad de los estudios encontrados se centran en el fútbol, ​​sabemos que es tal vez el deporte más popular a nivel mundial. También es interesante ver qué se estudia la predicción de resultados hasta en deportes como el criquet. La tabla muestra también el porcentaje que representa la cantidad de artículos por deporte para la cantidad de documentos recopilados.

Continuamos extrayendo de cada documento revisado, independientemente de la técnica de minería de datos que pueden afectar los mejores resultados de predicción. De esta manera, si una investigación comparaba para un ejercicio específico varias técnicas, específicamente lo asociado a la técnica con valor de predicción más representativo. La siguiente tabla muestra las técnicas más utilizadas:

Por último, clasificamos por deportes nuestra base documental para saber una ciencia cierta, qué técnica usar para nuestras investigaciones futuras.

Las tablas mostradas a continuación, indican la velocidad promedio alcanzada por cada técnica en cada deporte identificado.

FÚTBOL

BÉISBOL

BALONCESTO

CRIQUETE

HOCKEY

TENIS

¿QUÉ PODEMOS CONCLUIR?

El fútbol se muestra como el deporte más popular a la hora de realizar predicciones deportivas, aplicando diferentes técnicas de minería de datos para su análisis siendo las Redes Bayesianas la que mejores resultados de manera exitosa (61% aproximadamente).

En el análisis de resultados deportivos, las técnicas de minería que mayor logró obtener, específicamente del deporte, son Bosques aleatorios, Máquina de vectores de soporte (SVM) y Redes Bayesianas, siendo superiores en más del 75% de las investigaciones revisadas frente a otras técnicas de minería.

Predicciones realizadas para deportes individuales como el tenis, aunque poco explorados por su poca experiencia frente a otros deportes como el baloncesto y el fútbol, ​​alcanzan efectos más altos (alrededor del 70%), tal vez porque depende del estado de un jugador y no de un equipo lo cual permite que exista una cantidad menor de factores que pueden afectar el resultado final de un partido.

Un deporte no muy popular pero del cual se encuentran diversas investigaciones aplicadas a la predicción deportiva es el criquet. Además de ello, los cuentos estudios alcanzan resultados de dificultad bastante elevados, con valores hasta del 70%.

PARA FINALIZAR ...

Les contamos que vamos a aplicar la técnica de Redes Bayesianas a la Champions League de este año (2019), siguiendo los resultados que encontramos, y de alguna manera, que les mostramos más adelante, intentamos superar esa dificultad del 61%. Si no hay una estrategia así para los parlays, ¡tal vez sea mejor dedicarnos a otra cosa!

Gracias por leernos ...

Jonathan Malaver

Written by

Systems and Computing Enginnering

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade