Y tú, ¿A dónde vas?

Addymar Maita
4 min readDec 5, 2019

--

Final de La Vuelta España 2019

¿Puede la Inteligencia Artificial predecir hacia dónde nos dirigimos? En una ciudad como Madrid en la que la mayoría de las personas cogen el transporte publico todos los días para ir al trabajo, hacer la compra, salir a tomar una cerveza por el barrio, etc. Parece que podríamos llegar a ser un poco predecibles ¿no?

AI Saturday’s es una organización sin animo de lucro cuya misión es capacitar a diversas personas para que aprendan Inteligencia Artificial más allá del camino educativo convencional.

La verdad es que los seres humanos somos el enigma más complejo y predecir a dónde vamos es de locos, aunque creo que el lugar donde todos los locos nos juntamos e intentamos hacer cosas que parecen imposibles es en AI Saturday’s (AI6).

Pero eso es lo bueno que tenemos los locos, es que no tenemos miedo a nada.

Aterrizando más es esta cuestión, se nos ocurrió que la mejor manera de empezar era conociendo nuestra ciudad, Madrid. Así empieza nuestra aventura, ¿cómo se mueve nuestra ciudad?

Pedaleando por Madrid

Para responder a la pregunta anterior, pensamos que teníamos que empezar por el transporte público. Es por eso que recurrimos a los datos abiertos de la EMT (Empresa Municipal de Transportes de Madrid) y en concreto con los datos de Bicimad el sistema de alquiler público de bicicletas de la ciudad.

La ventaja de utilizar estos datos y no la de los autobuses era la granularidad, ya que tenemos detalles de los recorridos de los usuarios y podíamos analizar personas y no líneas de autobuses. Además, en Madrid se hacen alrededor de 17.000 viajes diarios en bicicletas a través de bicimad. Y qué mejor manera de moverse por la ciudad que a través de una bici, sin ponerme a mencionar todas las ventajas medioambientales que ya conocemos.

El gran reto, los datos

Nos encontramos con una cantidad de datos descomunal divida por meses y en formato JSON, por lo que decidimos enfocarnos en un solo mes (junio del 2019). Pero primero, había que analizar los datos y conocer un poco el contexto y a los usuarios de Bicimad.

Si no sabemos cómo se mueve nuestra ciudad… ¿Cómo averiguamos cómo se va a mover?

En la fase de análisis descubrimos cosas como que las estaciones más populares para recoger las bicis eran las mismas donde luego se dejaban (algo un poco obvio). También, que el tiempo medio de viaje es de alrededor de 17 minutos, entre otras cuestiones.

Machine learning para predecir hacia donde vamos

El modelo que pensamos que más se ajustaba para predecir la estación de destino del usuario fue un Random Forest Classifier, basándonos en variables como la estación de recogida, tiempo de uso, tipo de usuario, rango de edad, día de la semana, entre otros.

Desarrollando el modelo, nos encontramos con varios condicionantes. Primero los datos, el id de usuario por cuestiones de privacidad cambia todos los días por lo que perdemos trazabilidad. También, falta de capacidad de cómputo, cada dataset de un mes es de alrededor de 400 mil filas por lo que si quisiéramos utilizar datos de un solo año nos encontraríamos con casi 6 millones de filas que nuestros ordenadores no pueden procesar.

A pesar de todas estas limitaciones seguimos adelante y desarrollamos nuestro modelo. Tuvimos un accuracy del 46%, muy bajo debido a dificultades como la cantidad de datos y la poca correlación de las variables, pero seguimos mejorando todos los días y ajustando más el modelo. Esto solo nos deja con más trabajo de cara al futuro, quizás utilizando datos meteorológicos, de otros medios de transporte como los patinetes, buses, metro, distinguir los días festivos, entre otros.

En definitiva, predecir a dónde van las personas es algo bastante complicado, pero no imposible. Y es que una predicción como esta podría ser muy útil para el servicio. Por ejemplo, para gestionar los flujos de demanda de cada estación, en cuáles se necesitarían más o menos bases, horas con más picos de demanda, etc. Esto podría extrapolarse a otros medios de transporte como los patinetes o las motos, aquí el limite lo marcamos nosotros.

La vida es como andar en bicicleta. No te caes a menos que planees dejar de pedalear. — Claude Pepper

Si queréis saber un poco más de como llevamos a cabo el proyecto no dudéis en echarle un ojo a nuestro Github.

--

--

Addymar Maita

Estudiante de Ciencia, Gestión e Ingeniería de Servicios en la Universidad Rey Juan Carlos. Me encanta aprender sobre Data Science e Inteligencia Artificial.