Augmented Democracy: facilitar el compromiso político con Inteligencia Artificial

Fran Garcia Bis
Saturdays.AI
Published in
11 min readSep 24, 2020

La democracia se ha convertido en una parte integral de la cultura occidental, algo que en muchos países es dado por supuesto. La realidad es, sin embargo, que por primera vez desde el auge de las democracias en los 70’s, los índices de libertad están cayendo de una forma sostenida y generalizada desde 2005 (Freedom House, 2019). De acuerdo con el sistema de detección temprana Mounk-Foa, existen señales de desconsolidación democrática en países occidentales cuyo estatus de democracia plena era hasta ahora incuestionable, y se ha desplomado el porcentaje de personas que opina que es “esencial” vivir en una democracia, particularmente entre las generaciones jóvenes (Martino, 2018).

Este proyecto se centra en España, aunque es replicable en cualquier sistema democrático. España, según cinco de los índices de medición de democracia más extendidos (Freedom House, Polity IV, Bertelsmann, WGI del Banco Mundial y The Economist), se encuentra entre el percentil 85 y el 100 de calidad democrática (Molina, 2019). Sin embargo, el país sufre una crisis de confianza en sus instituciones. Acorde al indicador Percepción de los principales problemas de España del CIS, los políticos en general, los partidos políticos y la política, suponen una de las 3 principales preocupaciones de los españoles, señalada como tal por más del 45% de los encuestados en noviembre de 2019 y solo superada por el desempleo (CIS, 2019). La última vez que el CIS preguntó por la satisfacción de los españoles con la democracia, en 2012, cerca del 70% se mostraban poco o nada satisfechos (Rama, 2016). Los datos de Eurobarómetro sitúan a los españoles como quienes peor valoran su sistema democrático en Europa occidental tras griegos e italianos, y otros indicadores como la politización de la promoción en la carrera judicial, encuestado por el European Network of Councils for the Judiciary (2019), nos sitúan como el peor parado de Europa. A esto se unen otros índices de calidad democrática como el V-Dem, que sitúa a España a la cola de las democracias occidentales, o la Fundación Alternativas, que le otorga una puntuación de 6 sobre 10 (Sánchez, 2019).

Si analizamos las causas de esta desconfianza en la democracia española, Torcal, en su estudio sobre la confianza política en España y Portugal, realizado por encargo del Ministerio de Innovación y Ciencia español, concluye que si bien la situación económica tiene un cierto efecto, el factor más relevante es la percepción de los ciudadanos de que el sistema político no responde a sus demandas. En concreto, la corrupción política y “la percepción de que las autoridades nacionales están respondiendo únicamente a las demandas e intereses de las organizaciones supranacionales y los actores económicos” (Torcal, 2014, p.19).

Fuente: Ale Arillo (CC BY-NC-ND 2.0)

¿Podemos conseguir que las autoridades nacionales puedan identificar y responder mejor a las demandas e intereses de la ciudadanía, y recuperar así la confianza en la democracia? Un equipo de voluntarios de Saturdays.ai creímos que sí, y por ello nos planteamos la realización de este proyecto, que involucra a la Inteligencia Artificial en el proceso de seguimiento y control por parte de la ciudadanía de los proyectos de ley que los diferentes partidos políticos presentan en el Congreso dentro de cada legislatura.

En este proyecto utilizamos algoritmos de inteligencia artificial que nos permiten extraer información de cada propuesta de ley y anticipar cuál sería la posición de cada ciudadano ante cada una de esas propuestas, poniendo en conjunción el contenido de la ley con las respuestas del usuario a un cuestionario sobre sus preferencias políticas, que para esta primera versión ha estado basado en el funcionamiento de aquienvoto.org -a quienes agradecemos su colaboración-. El usuario, tras registrarse y completar el cuestionario, recibirá todos los nuevos proyectos de ley, con información sobre su contenido, partido que lo ha presentado, votaciones en caso de haberse realizado, a qué áreas de interés afecta, y una predicción sobre su posicionamiento a favor o en contra de esta ley, predicción que el propio usuario puede corregir -ayudando así a aprender al algoritmo-.

Este mecanismo facilita la labor de control y de rendición de cuentas, favoreciendo que los partidos políticos se adecúen más a las verdaderas inquietudes y demandas ciudadanas.

En futuras versiones, nos planteamos añadir elementos que avancen hacia una democracia deliberativa, como incluir un sistema de argumentación estructurada para cada una de las propuestas de ley (los usuarios y otros agentes pueden añadir argumentos a favor y en contra de cada propuesta, que a su vez reciben votos positivos o negativos por parte de otros usuarios, dando más visibilidad a los argumentos con mayor apoyo). Además, abre la oportunidad de dar voz a organizaciones de la sociedad civil, que podrían también pronunciarse y mostrar su postura ante aquellas propuestas de ley que les afecten directamente (por ejemplo, ONG’s como Greenpeace o WWF podrían opinar sobre propuestas de ley que tengan implicaciones climáticas, pero también las organizaciones de empresarios o de consumidores).

En definitiva, se trata de un sistema que permite favorecer una democracia más fluida, mejor informada, estructurada en torno a una argumentación constructiva. Un sistema que ofrece una mayor información al ciudadano, a las organizaciones de la sociedad civil, y también a los legisladores, obteniendo en un termómetro en tiempo real de la acogida que tienen sus propuestas de ley para diferentes segmentos de población y organizaciones, con argumentos que permitan enriquecer estas propuestas y adaptarlas más a las demandas de la sociedad.

Obtención de datos

Nuestro proyecto se sostiene en dos conjuntos de datos: el perfil político y demográfico de un usuario, y las propuestas de ley.

El perfil político de un usuario refleja cómo se posiciona la persona respecto a determinados temas de la esfera política, como por ejemplo la economía liberal, las libertades civiles y la protección del medio ambiente. El perfil se obtiene a partir de las respuestas de los usuarios a una versión reducida del cuestionario de https://aquienvoto.org, en el que los usuarios expresan su grado de afinidad hacia dichos temas.

El perfil demográfico se obtiene a través de preguntas estándar como: sexo, fecha de nacimiento, código postal, tendencia política, renta estimada, entre otros.

El conjunto de datos de las propuestas de ley se creó a partir de la información publicada en la web del Congreso de los Diputados. Para completar la descripción de las propuestas de ley, les asignamos manualmente una puntuación respecto a los temas políticos que se usaron en el cuestionario. Así, perfiles de usuario y propuestas de ley fueron descritos en los mismos términos, y por lo tanto, pueden compararse.

Ingeniería de features

Al analizar los datos de partida encontramos dificultades en el reducido número de perfiles políticos. Al tratarse de una encuesta, los usuarios podrían no responder a todas las preguntas, por lo que es necesario eliminar aquellas filas que no contienen al menos un 70% de las preguntas del perfil político, lo que reduce aún más su número. En cuanto a las propuestas de ley, es necesario analizar cada una para asignarle una puntuación en cada tema. Esta valoración se realiza según nuestro criterio personal, y por lo tanto, puede verse afectado por nuestra parcialidad.

Otra dificultad sobre los datos de partida radica en el elevado número de features, cada línea de datos representa un usuario con su perfil política y demográfico, y una propuesta de ley con el acuerdo que el usuario definió, esto suma un total de más de 50 features de partida que puede llegar a convertirse en más de 100 con un tratamiento adecuado. Las hemos reducimos a tres niveles, primero descartando aquellas que no aportan información relevante, segundo haciendo muchas pruebas de correlación y con el algoritmo para entender las que aportar más relevancia y tercero usando una librería de terceros (featureselector) que nos permitía afinar el trabajo de ingeniería de features.

Descripción de la arquitectura del sistema

Para afrontar el problema, se diseñó inicialmente una arquitectura de componentes como la que se presenta en el gráfico 1. La arquitectura, creada a base de componentes, tiene tres elementos diferenciados. En primer lugar la parte del sistema que permite los inputs del usuario (test socio-político más datos demográficos) por otro lado, la parte que permite la entrada y el tratamiento de leyes, representada en la parte de abajo del diagrama. Por último, el core del sistema que es el componente donde relacionan ambas partes mencionadas y que contiene los modelos implementados de Machine Learning que permitirán la obtención de resultados.

Funcionamiento de la plataforma
Gráfico 1. Esbozo funcionamiento plataforma.

A continuación se presenta cada uno de los tres subsistemas en detalle:

Inputs de usuario

Estos inputs que aparecen representados en la parte superior de la arquitectura y se componen a su vez de dos partes, el test con preguntas socio-políticas, y otra serie de datos demográficos opcionales. A partir del test político se obtiene un resultado que permite posicionar al usuario del sistema con respecto a un topic de los incluidos en el test. Ambos inputs del usuario, tras ser tratados y analizados forman la primera parte del dataset que se utilizará para conocer el posicionamiento del usuario con respecto a una ley.

Propuestas de ley

En una primera versión del sistema se propuso la obtención de las nuevas leyes usando técnicas de web scrapping de la propia web del Congreso de los Diputados, o mediante el uso de APIs creadas por organizaciones terceras. A partir de las nuevas leyes se aplican diferentes modelos de Machine Learning para su limpieza y categorización, de una forma que el formato resultante pueda ser usado por el modelo de Machine Learning para predecir el % de acuerdo del usuario con esa nueva ley.

La versión actual del sistema no cuenta aún con la automatización de las entradas de las nuevas leyes, ni la inclusión de algoritmos de NLP para la limpieza y preparación de la misma. Actualmente el proceso es parcialmente manual.

Sí se utiliza NLP para obtener las palabras más relevantes de cada ley, lo que en el futuro se puede utilizar para buscar propuestas de ley por palabras clave en una futura aplicación web.

Core del sistema

El elemento fundamental del sistema, representado por el componente amarillo en el gráfico, es el que contiene los diferentes modelos de Machine Learning que se han probado en el sistema. En esta parte del proceso se utilizan los dos inputs mencionados anteriormente (inputs de usuario y nuevas leyes), y mediante diferentes modelos de predicción se obtiene el resultado con el porcentaje de acuerdo de un usuario con una ley. El usuario podrá en la siguiente versión del proyecto alimentar al sistema con feedback sobre sus resultados, permitiendo el reentrenamiento del modelo y la mejora de la precisión.

Algoritmos utilizados

Debido a la cantidad de datos con las que el proyecto contaba, es complicado conseguir que el modelo escogido obtenga un alto porcentaje de acierto, por lo que para la obtención de resultados se han probado diferentes modelos que se presentan a continuación:

  • Random forest
  • Linear Discriminant Analysis
  • K-Neighbours Classifier
  • Support Vector Machines
  • Gaussian Naive Bayes
  • Decision Tree Classifier

Si bien cada uno de los modelos mencionados puede estar orientado a situaciones concretas, el objetivo principal del proyecto era investigar y explorar diferentes posibilidades, por lo que finalmente decidimos incluir todas ellas y observar las diferencias en los resultados

Además de la elección del modelo, de cada uno de ellos se han probado diferentes combinaciones de hiper parámetros con el objetivo de encontrar las mejores combinaciones de cada una de ellas.

En la siguiente versión del proyecto se implementarán modelos más avanzados de deep learning para tratar de observar si diferentes modelos de redes neuronales mejoran los resultados del sistema.

Resultados

Tras las pruebas realizadas y la aplicación de los algoritmos mencionados con diferentes hiper parámetros, se obtuvieron los siguientes resultados por modelo:

Como puede observarse, el modelo Random Forest es el que ofrece una mayor precisión, con cerca del 73% de acierto. Entendemos que el sistema aún no es lo suficientemente preciso como para cumplir con los objetivos propuestos inicialmente, pero dado que el sistema ha sido construido con un dataset pequeño (entorno a 100 usuarios y 10 propuestas de ley) y dada la complejidad del sistema, el equipo está satisfecho con la primera versión.

¿Y ahora qué?

Esta primera versión del proyecto será presentada por el equipo en el demo day de la tercera edición de Saturdays.AI, pero el equipo seguirá trabajando en diferentes líneas:

  • Inclusión de nuevos modelos (Redes neuronales y Deep Learning)
  • Aumento del número de datos de entrenamiento
  • Aumento de la capa de datos e inclusión de nuevas variables
  • Creación de una aplicación web que permita al usuario interaccionar con el sistema

Si deseas informarte sobre el proyecto, o deseas colaborar en alguna de las líneas mencionadas para futuras versiones no dudes en contactarnos y encontraremos la forma de seguir aportando valor y acercarnos un poco más a nuestro objetivo:

“El uso de la tecnología para llevar la democracia al siguiente nivel”

Meet the team:

Daniel Medina: Opinno Cofounder and Consulting Business Director

Ignacio Laviña Faustmann: Digital Marketing Analyst at Accenture

Laura Inés Río-Chao Laseiras: QA Analyst at The Adecco Group

Fran García Bis: Spain Director en Civocracy.es. Product strategy consultancy in Climate&Planet area — Ashoka

Bibliografía

--

--