ClusterAI: balance 2018

martin palazzo
ClusterAI
Published in
4 min readFeb 9, 2019

El año 2018 superó todas las expectativas para el reciente grupo de clusterAI. Organizamos 2 eventos de Ciencia de Datos y Machine Learning en el aula magna de UTN FRBA, gestionamos junto con el departamento de Ingeniería Industrial la creación de la nueva materia electiva ‘Ciencia de Datos’ y creamos una comunidad activa de aprendizaje e intercambio de conocimiento. Todo estos resultados son producto de años de trabajo que comienzan desde el año 2015.

Malena y Eduardo realizando Procesamiento del Lenguaje Natural en Python.

El desafío que nos planteamos fue poder brindar por un canal formal y abierto conocimiento de Ciencia de Datos y Machine Learning a los futuros ingenieros. Consideramos que la manera de abordar problemas desde los datos es un enfoque de crucial importancia en la actualidad y en las próximas décadas. También reconocemos la necesidad de crear comunidad que permita intercambiar conocimiento fluidamente y fomentar la propuesta de ideas. Nuestro programa se centró en 4 pilares:

  • Enseñar a programar. Utilizamos el lenguaje de programación Python soportado por el IDE Jupyter.
  • Análisis Exploratorio de Datos. Buscamos que los alumnos puedan explorar estadísticamente un set de datos y describir sus estructuras internas por medio de la visualización. La exploración permite formular mejores preguntas y generar abordajes mas estratégicos sobre los datos.
  • Aplicación de modelos de Machine Learning. Buscamos que los alumnos comprendan y luego apliquen los modelos más populares utilizando datos reales principalmente del Portal de Datos Abiertos de GCBA. Los modelos utilizados son ejecutados principalmente con la librería Scikit-Learn y Pytorch.
  • Comunicación de resultados. La etapa final consiste en que los alumnos generen una comunicación efectiva y comprensible sobre sus resultados y descubrimientos. El formato consiste en reportes escritos y una sesión de posters realizada el último día de clases.

Las clases cuentan con un módulo teórico sobre los modelos y técnicas a utilizar. Luego del teórico se brinda un módulo práctico para ejecutar los modelos aprendidos con distintos datasets. Cada clase finaliza con un módulo de trabajo práctico para que los alumnos hagan el seguimiento semanal de sus trabajos a presentar el último día del curso.

Agustin Velazquez explicando modelos de regresión multivariados.

También contamos con la visita de Martín Alalú y Felix Penna del Laboratorio de Datos Abiertos del Gobierno de la Ciudad de Buenos Aires. Esta visita es de gran importancia puesto que los alumnos conocen al equipo encargado de abrir los datos de la ciudad. La visita no solo describe los datasets, si no que también brinda información de las estructuras de datos abiertos, su funcionamiento y el impacto de las mismas.

El programa finaliza con el evento de fin de cursada realizado en el Aula Magna de la UTN FRBA. En el evento se invitó a Germán Rosatti y a Federico Baylé donde ambos compartieron sus trabajos en Big Data para el mapeo de la enfermedad de Chagas y procesamiento de imágenes satelitales con deep learning respectivamente. El evento incluyó también sesiones de posters con los trabajos finalizados de los alumnos.

Sesión de posters en el evento de fin de cursada. Los alumnos de Ingeniería Industrial compartieron sus resultados trabajando con datos reales y utilizando las técnicas aprendidas durante la cursada.

Entre los trabajos se presentaron proyectos como un análisis no-supervisado utilizando los datos de las pruebas Aprender, predicción del flujo vehicular en las autopistas AUSA, aplicación de modelos supervisados de clasificación utilizando datos del test de noviazgos violentos, detección de comunidades de pozos de extracción de pozos petroleros y predicción de siniestros de seguridad y crimen utilizando redes neuronales.

ClusterAI en números

  • 45 alumnas y alumnos de Ingeniería Industrial (cuatrimestre Ago-Nov 2018)
  • 15 clases (60 horas de cursada) + día de presentación final.
  • 14 trabajos presentados y comunicados por grupos de alumnos.
  • 120 asistentes al evento de presentación de trabajos.
  • 2 eventos realizados con la comunidad de ClusterAI en 2018.

Durante 2019 proyectamos recibir mas alumnos, continuar la formación de los futuros ingenieros en Ciencia de Datos y Machine Learning y reforzar la comunidad de Ciencia de Datos que estamos creando.

Agradecemos el constante apoyo del departamento de Ingeniería Industrial, al decano y equipo de prensa de UTN FRBA que nos acompañaron desde el principio en esta ambiciosa apuesta.

El equipo de ClusterAI.

--

--