Visualizando la desigualdad en Santiago con inteligencia artificial.

Usamos redes neuronales profundas para analizar 100.000 imágenes de Santiago y construimos una visualización con los resultados.

Andrés Cádiz Vidal
6 min readDec 9, 2019

Co-escrito con Tomás Ramírez

Para una versión más técnica (en inglés) click acá

Desde la semana del 19 de Octubre, Chile se ha visto inmerso en un llamado “estallido social”. Millones de personas a lo largo del país se han manifestado para pedir reformas estructurales al funcionamiento de la sociedad chilena.

El objetivo de este post no es ahondar en la discusión de lo que esta pasando (hay muchas otras fuentes para eso), sino que aportar con un granito de arena más al entendimiento de las causas.

Más de 1 millón de personas se manifestaron el 25 de octubre. Fuente

Dentro de la investigación que realizamos en el Laboratorio de Inteligencia Artificial de la PUC (IALAB PUC) para el proyecto de Inteligencia Artificial Explicable del Instituto Milenio Fundamentos de los datos, junto con el Departamento de Ingeniería de Transporte y Logística de Ingeniería UC, hemos estado estudiando la modelación de la percepción urbana (un poco más abajo te explicamos qué es eso) mediante inteligencia artificial (IA).

La IA nos da la posibilidad de analizar la información de miles de imágenes de forma mucho más eficiente que un humano, por lo que permite generar insights que serían imposibles de obtener de forma manual. Haciendo uso de esta herramienta analizamos la percepción de ~120.000 imágenes de Santiago.

En qué consiste

Basándonos principalmente en la investigación de Dubey, et al. (2016) entrenamos redes neuronales que son capaces de emular la percepción humana de una foto urbana en base a 6 criterios: riqueza, depresividad, seguridad, vivacidad, aburrimiento y belleza (entrenamos una red por cada criterio). Es decir, creamos modelos que a partir de una imagen generan un número que representa, por ejemplo qué tan segura se ve.

Dos ejemplos de los resultados obtenidos por las redes a partir de las imágenes. A la izquierda el palacio de la moneda y a la derecha una población en lo espejo.

Para lograr que la IA pueda obtener resultados, necesita de muchos datos que le enseñen cómo se ve un lugar “rico” , o un lugar “depresivo”. Para eso usamos 1,2 millones de votos humanos, que fueron recopilados a través de una plataforma por los autores del paper mencionado arriba. Los usuarios se les presentaban dos imágenes y ellos debían decidir cuál les parecía que representaba mas una de las 6 categorías, por ejemplo: ¿Cuál de las imágenes es más segura?

Plataforma Place pulse usada para recolectar los datos. Fuente acá

Usando esos datos hacemos que la red entrene y por lo tanto aprenda a votar como lo hacen los humanos. Luego de unas 10 horas de entrenamiento para cada categoría la red es capaz de comparar dos imágenes y decidir por cuál votar intentando emular el comportamiento humano, basándose en un número obtenido a través de millones de operaciones matemáticas sobre los pixeles de la imagen. Para el resultado final vamos un paso más allá y llevamos ese número obtenido a un valor entre -5 y 5, que representa qué tanto se percibe el criterio en la imagen.

Diagrama muy simplificado de lo que se esta haciendo. Cada figura representa una capa de la red.

Finalmente, usamos los modelos obtenidos para rankear los espacios urbanos de Santiago, con la ayuda de ~120.000 imágenes de Google Maps.

Visualizando y analizando los resultados

Para poder evaluar los resultados, construimos una visualización de estos en un mapa de Santiago (¡revísala aquí!). Basta con mirar un rato el mapa con cualquiera de los 6 atributos para notar cualitativamente que los resultados tienen bastante sentido.

Visualización de Santiago para el atributo riqueza y una muestra de 5000

Si es que no pudiste ver los resultados en el mapa interactivo puedes ver un panorama general en la imagen de abajo.

Visualización para muestra de 50000. En orden: riqueza, depresividad, seguridad, vivacidad, aburrimiento y belleza.

Quienes conocen la ciudad de Santiago, podrán observar una correlación entre los sectores de mayor ingreso per cápita — hacia el sector nororiente de la ciudad — con la percepción de atributos cualitativos de la ciudad que son considerados positivos.

Santiago se comporta de forma similar a muchas ciudades latinoamericanas en las cuales se logra identificar un sector de altos ingresos que se extiende desde el centro histórico de la ciudad hacia el exterior en forma de cono. La red neuronal, muestra que el desarrollo segregado de Santiago no solo ha significado el desplazamiento de bienes, servicios e indicadores socio económicos, sino que también se ha llevado consigo la belleza, las percepciones de seguridad, alegría y vivacidad de los espacios.

Distribución del ingreso medio por hogar en Santiago. La correlación con el análisis de imágenes es evidente. Fuente: Encuesta Origen Destino 2012

Ahondando en la explicabilidad de los resultados

Hoy el explicar por qué un modelo de redes neuronales responde lo que responde, es un problema de investigación no resuelto y altamente relevante en la disciplina. Como parte de este trabajo es de mucho valor poder entender qué cosas definen que una imagen se vea por ejemplo,“más depresiva”.

Para complementar la capacidad predictiva del modelo de aprendizaje automático, se utilizaron técnicas econométricas para volver, en medida de lo posible, interpretable el proceso de decisión de la red neuronal. Para ello, mediante dos algoritmos (¡más redes!) que permiten parametrizar la imagen en base a elementos humanamente entendibles. Para esto usamos la herramienta de detección de objetos de Tensorflow y el modelo de segmentación semántica SegNet.

Ejemplos de segmentación semántica. Fuente

Luego con estas variables se estimó un modelo econométrico para cada criterio, obteniendo así información del efecto que tienen, por ejemplo, la presencia de árboles en la percepción de seguridad.

Los resultados en la tabla indican por cada columna cómo afecta dicho parámetro en la percepción (entre paréntesis la significancia estadística) . Por ejemplo, en la segunda fila, el primer valor indica que la variable edificios tiene un efecto negativo sobre la belleza, cuantificado en -0,0983. Los resultados de esta tabla no tienen unidades de medida tangibles, por lo que no es posible otorgar una valoración absoluta, pero lo interesante es que permite comparar los valores con otras variables. Del estudio podemos resaltar ciertos hallazgos interesantes, como por ejemplo, que la presencia de ciclistas y peatones tiene un efecto promedio positivo en la percepción de seguridad, vivo. Incluso nos permiten comparar la magnitud del efecto de cada variable, siendo por ejemplo vegetación y la presencia de ciclistas, las más relevantes para determinar la belleza de un lugar.

En qué estamos ahora

Nuestro grupo de investigación ha replicado el experimento de Dubey et al. para incluir nuevas variables que nos permitan asociar la percepción a las características del usuario. Nuestro proyecto se llama Wekun, palabra de la lengua Mapudungun que significa “afuera”. En ella preguntamos la percepción sobre qué lugar parece mejor para caminar, qué lugar parece mejor para vivir y se mantienen la preguntas sobre seguridad, belleza y riqueza. Además, se incorpora una nueva sección en la cual se pide información sociodemográfica de quien contesta. Con esto hemos logrado detectar diferencias en la percepción entre hombres y mujeres, y entre peatones y ciclistas en contraste a las de los automovilistas.

En la figura se muestra en rojo los lugares con mayor disminución porcentual de la percepción de caminabilidad según las mujeres. En rojo destaca el centro de la ciudad y las grandes ejes de movilidad vehicular.

Diferencias en la percepción de caminabilidad de mujeres en comparación a la de hombres. En rojo las zonas con mayor disminución.

Está investigación es parte del trabajo realizado en el Departamento de Ingeniería de Transporte y Logística de Ingeniería UC y en el Laboratorio de Inteligencia Artificial de la PUC (IALAB PUC) que es parte del Instituto Milenio Fundamentos de los datos.

Agradecemos a todos los que han trabajado históricamente en esta investigación, particularmente a Tomás Rossetti, Hans Löbel, Víctor Rocco y Ricardo Hurtubia, autores del trabajo que sentó las bases que hicieron posible este post.

--

--

Andrés Cádiz Vidal

Software Engineer at platan.us. AI researcher and adjunct professor at IALAB-PUC. Haciendo tecnología desde Chile pal mundo.