Yo, reutilizador de datos. Caso Fede B.

Federico Bayle
BuenosAiresLAB
Published in
3 min readJul 27, 2017

--

Soy Fede Baylé, licenciado en Economía y voy a contar cómo me ayudaron los datos abiertos de la Provincia de Buenos Aires para realizar mi tesis de la Maestría en Data Mining de la Universidad de Buenos Aires.

En 2011 y 2013 la organización sin fines de lucro Un Techo Para Mi País llevó adelante diversos estudios que demuestran la dificultad, en materia de logística y de costos, que implica relevar asentamientos y villas en nuestro país. El objetivo del proyecto, basado en esta información, fue elaborar una metodología para eficientizar este tipo de relevamientos.

El campo de análisis está acotado al partido de La Matanza, por ser el más extenso del conurbano bonaerense y el segundo municipio más poblado del país.

En amarillo, las villas relevadas en la localidad de González Catán del partido de La Matanza.

A la hora de examinar las herramientas con las que contaba para enfrentar este desafío los datos abiertos publicados por la Provincia de Buenos Aires fueron un factor clave. Conjuntos de datos tales como los catastrales, vías de tren, ríos y canales, calles, delimitación territorial y muchos otros más fueron de gran utilidad. En particular la organización y usabilidad de la plataforma de datos abiertos me ayudaron a ahorrar mucho tiempo de procesamiento e investigación. Otro aspecto significativo del análisis fue el procesamiento de imágenes satelitales. Ambas fuentes se complementan muy bien y permiten potenciar el trabajo.

El resultado alcanzado con la tesis fue realmente satisfactorio, logré la reducción de un 85% del territorio a relevar. Fue en este resultado donde encontré la motivación para ir un poco más allá y ampliar los límites. La metodología implementada en La Matanza había logrado un resultado mejor del esperado, entonces ¿podría ser útil aplicarla a un territorio más amplio que el partido de mayor extensión del conurbano bonaerense? Decidí implementar el mismo desarrollo, esta vez, a nivel país y visualizarlo a través de un mapa de potenciales villas y asentamientos. El mismo se encuentra en un repositorio abierto, donde los datos resultantes del procesamiento están libres para su descarga y donde también puede descargarse el contenido de la tesis. Este es el resultado en versión experimental, el cual sigo desarrollando: fedebayle.github.io/potencialesvya/

Probabilidad de villa. Cuánto más oscuro el rojo, más probable.
Relevamiento oficial y probabilidades superpuestos.

Me entusiasma la posibilidad de escalar el procesamiento a otros países. En particular, la conjunción de algoritmos de redes neuronales, imágenes satelitales públicas y datos abiertos dotan a esta metodología de una elevada precisión con un bajo costo de procesamiento. La disponibilidad periódica de imágenes permite contar un relevamiento actualizado permanentemente.

Portada web con mapa a nivel nacional.

Por último, no quiero dejar de destacar la utilidad y necesidad de publicación de datos abiertos. Considero que la planificación de políticas basadas en datos es algo de suma importancia para obtener resultados satisfactorios. Aún más si esos datos permiten desarrollar herramientas elaboradas por la comunidad, volviendo esto un círculo virtuoso.

Desde Buenos Aires LAB, te invitamos a conocer la Plataforma de Datos Abiertos de la Provincia de Buenos Aires y a compartir, reutilizar la información que es de todos.

--

--