ClusterAI: Feria de Datos y balance 2019

martin palazzo
ClusterAI
Published in
5 min readDec 10, 2019

El 30 de Noviembre 2019 celebramos por segundo año consecutivo con clusterAI la Feria de Datos en el Aula Magna de UTN Buenos Aires. La misma fue organizada y gestionada por la cátedra de Ciencia de Datos de la carrera de Ingeniería Industrial y contó con el apoyo del Departamento de Ingeniería Industrial y la Secretaría de Ciencia y Técnica de la universidad. La Feria de Datos es el evento que festeja la finalización de la cursada de la materia Ciencia de Datos (conocida como clusterAI). En esta ocasión tuvimos el agrado de cubrir el 100% de la capacidad del Aula Magna de la Facultad.

En el evento las alumnas y alumnos exponen en formato poster los desarrollos y proyectos que estuvieron trabajando durante el curso. También es un espacio donde referentes del área son invitados para poder compartir avances. El evento en números:

El Aula Magna de UTN FRBA llena de asistentes curiosos por Ciencia de Datos.
  • 120 participantes. Entre ellos se encontraban estudiantes de UTN BA como tambien graduados y estudiantes de otras casas de estudios.
  • 60 estudiantes presentando sus avances.
  • 20 proyectos presentados por los estudiantes de la materia de Ciencia de Datos.
  • 2 oradores invitados como referentes

Sobre la Feria de Datos

Entre los oradores se encontró Emmanuel Iarussi quien realizó una introducción a la computación gráfica y compartió sus últimas investigaciones. Sus publicaciones son accesibles desde su perfil de Google Scholar.

Emmanuel Iarussi explicando los fundamentos de computación gráfica.

Emmanuel es investigador de CONICET y se especializa en computación gráfica basada en datos. Entre las aplicaciones que desarrolla se encuentran los Modelos Generativos Adversarios (GANs o Generative Adversarial Networks). Estos modelos se especializan por aprender la distribución de probabilidad de datos complejos como imágenes. Luego la GAN puede utilizar la distribución aprendida para generar datos nuevos, es decir generar imágenes nuevas que no necesariamente son iguales a las utilizadas en el entrenamiento.

Por otro lado contamos con la participación de Laura Ación, investigadora CONICET del Instituto del Cálculo cuyo enfoque de investigación es la bio-estadística. Laura lleva años trabajando con datos de salud y bio-medicina. Puntualmente Laura enfocó su charla a aprendizaje estadístico y a una novedosa técnica de Machine Learning llamada “Super Learning”. Su objetivo se basa en utilizar técnicas de Machine Learning para las Ciencias de la Salud.

Laura Ación explicando el modelo de Super Learning.

Por medio de Super Learning ella busca ensamblar múltiples modelos de aprendizaje supervisado con el fin de mejorar la predicción de cáda uno por separado, tal como hizo en el trabajo que publico en 2017. Además Laura compartió las iniciativas que esta llevando a cabo en distintas comunidades de Ciencia de Datos como The Carpentries y Latin-R para potenciar y estimular a los estudiantes y practicantes de la región.

Los trabajos presentados

También se contó en simultáneo con la feria de posters donde los 60 estudiantes de clusterAI presentaron los 20 trabajos que desarrollaron durante la cursada de la materia.

La feria de posters de los estudiantes de clusterAI.

Es importante remarcar que entre los estudiantes se encontraban 50 alumnas y alumnos de Ingeniería Industrial de UTN BA y además egresados de otras ingenierías, ciencias económicas, biología y neurocientíficos demostrando que el potencial de la ciencia de datos no se limita a ninguna especialidad.

Los trabajos presentados fueron:

  1. Modelos de Regresión aplicados a violencia familiar: poster y código-reporte.
  2. Detección de comportamientos financieros con machine learning: poster y código + reporte.
  3. Predicción del tipo de de los árboles de la Ciudad de Buenos Aires: poster y código + reporte.
  4. Mapa de Oportunidades Comerciales de Buenos Aires: poster y código + reporte.
  5. Análisis de la calidad de aire mediante Machine Learning: poster y código + reporte.
  6. Análisis de robos de autos en Argentina: poster y código-reporte.
  7. Modelo de predicción de faltante de mercadería en góndola: poster y código + reporte.
  8. Predicción de producción de petróleo en Argentina: poster y código + reporte.
  9. Predicción de índices de pobreza en Argentina: poster y código + reporte.
  10. Análisis de datos en el Sistema Único de Atención Ciudadana de Buenos Aires: poster y código + reporte.
  11. Modelo de Clasificación de comunas de CABA a partir de sus materiales reciclados: poster y código-reporte.
  12. Predicción de subsidios a empresas de colectivos utilizando modelos de regresión: poster y código-reporte.
  13. Aplicación de modelos de regresión para la predicción de defunciones en Argentina: poster y código-reporte.
  14. Aprendizaje no supervisado en e-commerce de cervezas: poster y código-reporte.
  15. Predicción del flujo de ciclistas en la ciudad de Buenos Aires: poster y código-reporte.
  16. Predicción de viajes en colectivo a través de modelos de regresión: poster y código-reporte.
  17. Estudio de producción de cultivos en Argentina: poster y código-reporte.
  18. Predicción de precios de propiedades via Machine Learning: poster y código-reporte.
  19. Predicción de denuncias de consumidores: poster.
  20. Predicción y clustering de precios en estaciones de servicio: poster y código-reporte.
  21. Análisis de datos de Eco-Bicis: poster y código.

La feria de posters es un hito fundamental dado que los estudiantes pueden recibir devoluciones y sugerencias de como mejorar sus trabajos.

Las clases de ClusterAI

Estudiantes presentando sus trabajos.

El curso de Ciencia de Datos de clusterAI consiste en 14 clases donde estudiantes sin conocimientos previos de programación ni machine learning deben validar mediante instancias de evaluación teóricas y prácticas conocimientos básicos. Además la evaluación culmina con la entrega de los trabajos prácticos finales. El curso esta estructurado en 7 grandes áreas:

  • Programación en Python con Jupyter Notebooks y Anaconda.
  • Análisis exploratorio de datos y visualización
  • Aprendizaje Supervisado.
  • Aprendizaje No Supervisado.
  • Reducción de la dimensionalidad.
  • Análisis de Sentimiento y Procesamiento del Lenguaje Natural
  • Redes Neuronales.

Durante cada clase se dedica un tiempo a profundizar conceptos teóricos, otro a realizar prácticas y ejercicios y por último una fracción de cada clase es dedicada a pensar el trabajo a presentar por cada estudiante.

Una clase de clusterAI.

Parte del objetivo es que el aula sea parte del espacio de experimentación para los estudiantes . Para el 2020 esperamos poder mantener la misma cantidad de estudiantes incrementando la diversidad entre alumnas y alumnos de distintas ingenierías como así tambien otras especialidades. ClusterAI es un producto de la educación pública.

.

Martín Palazzo, docente y coordinador de clusterAI.

--

--