Análisis de las Elecciones Generales del 26J en Twitter, desde la perspectiva del Big Data

Iago
Gradiant Talks
Published in
19 min readNov 6, 2016

El 26 de Julio de 2016, los españoles fuimos llamados a las urnas por segunda vez en menos de un año, para volver a votar a los mismos candidatos a la presidencia del Estado, tras el fracaso de intento de investidura de los candidatos votados el 20 de diciembre del 2015.

Tendencia de conversación sobre los partidos políticos durante la campaña del 26j

Como analista de medios sociales, no puedo dejar de preguntarme sobre cómo influyen estos canales en decisiones tan importantes como son la elección de un Gobierno. Además en esta ocasión, las expectativas de un posible cambio significativo, en la estructura política nacional, hacen todavía más necesario este tipo de análisis. En otras palabras, intentaré resolver la siguiente cuestión:

¿Porque Twitter no fue una fiesta tras el 26J ?

La mayor parte de nosotros, somos conscientes de la importancia que ha tenido la red social TWITTER en algunas de las revoluciones sociales más importantes de la última década.

Quizás sea hora de revisar la vigencia de Twitter como medio de influencia política, y replantearnos si sigue siendo el lugar adecuado para identificar tendencias claves y con un impacto real fuera de su plataforma.

La dimensión del reto es considerable (siendo justos masiva), dado que obliga al análisis de grandes volúmenes de publicaciones. Es la ocasión perfecta para poner a prueba las últimas tecnologías en procesado de lenguaje natural desarrolladas por el Centro tecnológico TIC Gradiant, dentro del proyecto GLIK, que consiste en una suite de herramientas de análisis de contenidos, desarrollada sobre tecnologías de procesado de lenguaje natural que aprovechan la potencia del deep learning en este campo.

Hemos analizado más de 15 millones de tuits, capturados en tiempo real durante toda la campaña electoral del 26J, hasta aproximadamente una semana después de conocer los resultados (periodo del 10 de Junio al 4 de Julio de 2016).

Un pequeño disclaimer antes de empezar con las conclusiones. Este artículo no es un “análisis político”, se trata de la interpretación de un analista de medios sociales, sobre un fenómeno social en torno a un evento político. Interpreto datos; conclusiones extraídas de textos creados por otras personas (por miles de ellas), no estoy exponiendo mi opinión personal. Quizás tu interpretación sea diferente, en ese caso genial, abramos el debate en la sección de comentarios.

¿Qué se ha dicho sobre los distintos candidatos?

Para poder identificar esas menciones con mayor impacto, he utilizado la herramienta “detector de historias” perteneciente a la suite Gilk, que a través de un algoritmo exclusivo logra identificar y agregar aquellas menciones que tratan sobre un mismo tema, incluso cuando no utiliza exactamente las mismas palabras.

Llamamos HISTORIA a un conjunto de tweets con contenido parecido (no solo retweets) que se produce durante un cierto periodo de tiempo, y que generamos automáticamente gracias a un algoritmo de detección de historias de Glik. De este modo, podemos identificar fácilmente, entre millones de tweets, los temas que son tendencia y que han dado más juego entre los usuarios de Twitter.

Las 10 HISTORIAS más relevantes sobre Mariano Rajoy (total de menciones recibidas 1.511.056):

Mariano Rajoy (fuente 20m.es)
  1. Nuevo milagro económico de Rajoy. Ayer nos acostamos siendo la 4ª economía de la UE y hoy nos despertamos siendo la 3ª. #Afavor (4699 posts)
  2. El PP amenaza con una demanda a El Mundo Today por la web ‘Rajoy presidente’ (4066 posts)
  3. “Tenemos una gran nación y tenemos algo muy importante: tenemos españoles”. Rajoy diciendo cosas en una granja de vacas. #CamPPaña (3566 posts)
  4. “Hemos ganado las elecciones y reclamamos el derecho a gobernar” #ELPAIS26J ( 3284 posts)
  5. Rajoy: “España será lo que los españoles quieran que sea”. Sigue el 26-J al minuto (2318 posts)
  6. #Afavor #Debate13J con @marianorajoy (2304 posts)
  7. Rajoy dice que han hecho mucho contra la corrupción. Yo solo he visto indultar corruptos, dejar penas suaves y ponernos trabas a los jueces (2045 posts)
  8. Fernández Díaz aseguró que Mariano Rajoy conocía su actuación para incriminar a independentistas (1843 posts)
  9. @marianorajoy: “Si nos comprometemos a dejar gobernar al partido más votado, no habrá elecciones” #debate13J (1835 posts)
  10. El baño de masas de Rajoy en Molina o la manipulación informativa en dos imágenes (1490 posts)

Salta a la vista que algunas de las historias más populares sobre Rajoy, no han sido impulsadas por el bando político favorable a su candidatura. La ironía, la presión sobre asuntos que afectan negativamente a la imagen del partido, representan una gran parte de las menciones a este candidato. Podemos apreciar, que el aparato de campaña propio del PP apenas logra el 50% del impacto que sus opositores consiguen en este canal.

Mariano Rajoy ganó la partida en Facebook pero mantuvo el tipo en Twitter

Al término de la campaña, se dio a conocer la estrategia basada principalmente en Facebook creada por la agencia Messina Group y su Gurú Isabelle Wright, que tras el batacazo recibido en su campaña por el No al Brexit se pudieron resarcir participando en el bando ganador (o como dice el propio partido “en la lista más votada”) en una de las elecciones más competidas de la historia de España.

Las 10 HISTORIAS más relevantes sobre Pablo Iglesias (total de menciones recibidas 875.368)

Pablo Iglesias (fuente 20m.es)
  1. @Pablo_Iglesias_: “Si la gente va a votar con alegría y esperanza, no ganarán los de siempre. Unidos y unidas, podemos” #debate13J (5321 posts)
  2. ¿Sabe que no soy presidente porque el señor Iglesias no quiso? -Por favor policia. (5091 posts)
  3. “Hay que decirles a los poderosos, a los arrogantes, hasta la victoria”, se ve que Pablo Iglesias no sabe aún los resultados #L6elecciones ( 3985 posts)
  4. RT @Pablo_Iglesias_: Día triste para Europa. Debemos cambiar de rumbo. De una Europa justa y solidaria nadie querría irse. Tenemos que camb… ( 3882 posts)
  5. RT @Pablo_Iglesias_: Gracias a tod@s l@s que habéis seguido, seguís y sé que seguiréis luchando contra las políticas injustas. ( 2600 posts)
  6. Impresionante el minuto de oro de @Pablo_Iglesias_ #debate13J (2502 posts)
  7. #26J Pablo Iglesias tras votar: “Hoy no escogemos solo una papeleta, sino el camino hacia un futuro mejor” ( 2261 posts)
  8. Lo estamos tocando con los dedos, este 26J, victoria de la gente. #VotaUnidosPodemos26J https://t.co/E5nWFW1pBH (2084 posts)
  9. Ayer Iglesias negaba que Podemos plantee la salida de España del Euro. Aquí explica muy bien su plan para hacerlo. (1926 posts)
  10. RT @Pablo_Iglesias_: Esta semana el escenario es todo vuestro. Saltaréis a las tablas para la obra de vuestra vida #YoNoMeLoPerdería ( 1861 posts)

En este caso el aparato propagandístico del entorno de Pablo Iglesias, logra situar su propio contenido entre las historias más populares del candidato. Sin duda, esto es un claro indicador de la fortaleza del partido en este canal, en el cual han logrado dominar la conversación sobre si mismos… y en gran medida sobre parte de otros partidos y candidatos. Ahora bien, esto no implica necesariamente que las audiencias menos afines le hayan prestado una atención proporcional a su capacidad de generación de contenidos.

Las 10 HISTORIAS más relevantes sobre Pedro Sanchez (total de menciones recibidas 767.589)

Pedro Sanchez (fuente 20m.es)
  1. Atención al momentazo #fijoquemanchan de @sanchezcastejon… ( 5996 posts)
  2. Si todos los socialistas van a votar el #26J habrá cambio. @sanchezcastejon (2715 posts)
  3. RT @sanchezcastejon: No todo vale en politica. Me entristece la manipulacion y el juego sucio que algunos practican. #NoTodoVale ( 2648 posts)
  4. Me puedes explicar esto? @sanchezcastejon https://t.co/jAbcey6Adt (2630 post)
  5. RT @sanchezcastejon: Vaya paliza me están dando… (1923 posts)
  6. @sanchezcastejon: “En 2 años me someteré a una cuestión de confianza” #debate13J (1743 posts)
  7. @sanchezcastejon: Lo que ha ocurrido con el Brexit es la confluencia entre el populismo y una ultraderecha irresponsable (1407 posts)
  8. Iglesias cuando está con Teresa es anticapitalista, con Garzón comunista, conmigo socialista, miedo me da que se quede encerrado con Rajoy. (1285 posts)
  9. PP y Podemos usan burdamente un vídeo para acusar a @sanchezcastejon de racista #NoTodoVale #LaPinzaDeLaCalumnia (1150 posts)
  10. Otra oportunidad perdida. Sanchez sigue sin aclarar si dará el gobierno a Rajoy o pactará un gobierno de cambio con nosotros. #Debate13J (1032 posts)

La historia más popular sobre Pedro Sánchez es realmente significativa de cómo ha transcurrido esta campaña, en la cual se han trabajado más las acciones de desprestigio al rival que a favor de la propia candidatura. Una peligrosa mezcla entre humor, ironía y manipulación informativa.

Las 10 HISTORIAS más relevantes sobre Albert Rivera (total de menciones recibidas 767.589)

Albert Rivera (fuente 20m.es)
  1. De Alfonso: “Albert Rivera me vino a ver y me dijo que me apoyaría, pero me pidió que les diera alguna cosa”. ¡Gooooolll! #FernandezDiazGate (4756 posts)
  2. En Bcn, aunque Colau quería prohibirlo, disfrutamos de la selección en la calle ¡Cataluña somos todos! #CsConLaRoja (2996 posts)
  3. RT @Albert_Rivera: Si los votos valieran igual este seria el resultado con una ley electoral justa : PP 119 PSOE 82 Unidos Podemos 76 C’… ( 2829 posts)
  4. Un fuerte abrazo a los compañeros agredidos esta tarde @CsMadVallecasP. #Nonoscallaran, os lo aseguro (1445 posts)
  5. Las mentiras, falsedades y calumnias de Albert Rivera (1443 posts)
  6. @Albert_Rivera BDE afirma influencia de bancos en IRPH (Mercantil 4, Burgos — art. 1256 CC), Por qué sigue siendo oficial? #irphestafa (1315 posts)
  7. RT @Albert_Rivera: La Asamblea de Venezuela pide a Iglesias que explique el uso de los 7,1M que dio el gobierno Chávez a su fundación. (1101 posts)
  8. Rivera vincula sin pruebas a Podemos con los ataques a Ciudadanos (1043 posts)
  9. @Albert_Rivera: “Acuerdos por sillones, no. Acuerdos para cambiar España, sí” #debate13J (1009 posts)
  10. Albert Rivera ya esta Londres abrazando ingleses. (989 posts)

En el caso de Albert Rivera llama la atención la intensidad de la presencia de personalidades de otros partidos en sus historias.

Volumen no es lo mismo que representatividad

Volumen de publicaciones recibidas por cada candidato

Mariano Rajoy ha sido el candidato más comentado, pero ojo al dato, hablamos de volumen de menciones. Esto no es necesariamente un indicador positivo, ya que una cosa es que hablen de uno, y otra cosa es que hablen bien.

Tendemos a pensar que tener un gran volumen de participantes en una muestra es igual a tener una gran representatividad para un estudio. El problema, es que puede que estés recogiendo todas las muestras en el mismo subconjunto del grupo. ¿Acaso es esto lo que sucede cuando se intenta hacer una análisis de una campaña política sólo con datos de Twitter?

Como hemos podido ver en el punto anterior, la diferencia de actividad en Twitter del entorno de Unidos Podemos con respecto a las demás opciones, es abrumador, todo parece apuntar que Twitter no es la mejor plataforma para que los usuarios manifiesten su afinidad a las políticas de la derecha. Esto no es un fenómeno exclusivo de la era digital, ya en 1977 “La teoría de la espiral del silencio” de E Noëlle-Neumann, nos planteaba la existencia de una pulsión de auto-represión de de las opiniones minoritarias, estas simplemente no se manifiestan.

Resulta sumamente interesante, para ponderar el peso individual de cada candidato, analizar las veces que comparten presencia con otros candidatos en un mismo tuit.

Este gráfico muestra las relaciones entre los diferentes candidatos en base al nº de menciones que han compartido.

Menciones compartidas entre candidatos

En la siguiente matriz, podemos ver el volumen de conversación compartida entre los distintos candidatos, así como las menciones en solitario de cada uno de ellos:

Conversación compartida entre los distintos candidatos al 26J

Mariano Rajoy, es quien ha recogido más tuits en solitario, seguido de Pablo Iglesias, mientras que Pedro Sánchez, ha sido el candidato que más % de conversación ha compartido con los otros tres, especialmente con Mariano Rajoy con quien comparte casi un 12% de lo conversación, ilustrándose aquí el intento del PSOE por mantener la dualidad del bipartidismo y también el intento de los “nuevos partidos” por representar a Mariano Rajoy y a Pedro Sánchez como integrantes de la vieja política.

Llama bastante la atención, que los nuevos candidatos compartan una baja cuota de su conversación en relación a la que comparten con las opciones tradicionales. Sabemos que la estrategia de Pablo Iglesias ha sido postularse como rival directo de Rajoy, y como socio de Pedro Sánchez, al igual que Albert Rivera ha situado su eje de acción fuera del marco planteado por Podemos como consecuencia de la apuesta de este partido a favor del referéndum catalán. Por lo tanto, podemos afirmar que ambos candidatos han evitado el enfrentamiento directo, o al menos que este enfrentamiento no ha tenido un eco especialmente significativo en Twitter.

¿Qué se ha dicho sobre los principales partidos?

Al poner el foco en la conversación compartida entre los diferentes partidos políticos, el mapa de espacios compartidos refleja algunos matices diferentes al de los candidatos:

Menciones compartidas entre partidos políticos candidatos a la presidencia del 26J
Menciones compartidas entre partidos políticos candidatos a la presidencia del 26J

Los % nos indican claramente que el partido con mayor número de menciones independientes de otros partidos ha sido Unidos Podemos, a una considerable distancia del resto de partidos, siendo el PP el rival con el que más veces han coincidido, y Ciudadanos el que menos veces ha compartido espacio con Unidos Podemos. Unidos también ha sido el partido que más menciones ha acumulado en términos absolutos.

Share de los Partidos Políticos durante la campaña del 26J

El PP y PSOE han sido, sin duda alguna los que más veces han aparecido juntos, representando para el PSOE casi una cuarta parte del total de la conversación sobre su partido.

Con un 50,26% de conversación exclusiva, el PSOE ha tenido menos opciones que cualquier otro partido para dar visibilidad a su discurso específico.

La hegemonía de la anticampaña. El argumento de campaña es simple y básico: “NO DEBES VOTAR AL RIVAL”

Quizás ninguno lo exprese en estos términos, pero es el probablemente el mensaje en el que más coinciden todos.

Historias que ejemplifican el foco en el argumento del desprestigio al rival

Lo pueden decir de mil maneras diferentes, incluso a veces a través del humor, pero lo que está claro, es que la mayor parte de las menciones (más del 50%) relacionadas con los partidos o los candidatos han sido negativas, frente a menos del 10% positivas.

Posiblemente el contexto más conflictivos en términos de imagen de marca sea el contexto político de campaña.

Los últimos avances tecnológicos en análisis de opinión hacen visible y medible una realidad que muchos podíamos intuir, y es que el contexto político da lugar a una polarización extrema en la expresión del sentimiento hacia una “marca/partido”.

Para este análisis de sentimiento se ha empleado un novedoso sistema basado en el entrenamiento de una inteligencia artificial, que permite aplicar el criterio del analista a gran escala. De otro modo, necesitaríamos meses, para realizar a mano el trabajo que este algoritmo ha logrado realizar en horas, con una precisión comparable al de un equipo humano bien coordinado.

Sentimiento por candidatos

Este gráfico muestra la evolución del sentimiento hacia los candidatos en una escala de 0 a 10, siendo 10 todo positivo, y siendo 0 todas las menciones negativas. Dado que en ningún momento se supera el 5 (ni siquiera el 4), el sentimiento hacia los candidatos ha sido, constantemente negativo.

En general, el inicio de campaña ha coincidido con un acusado empeoramiento de sentimiento expresado en los contenidos que mencionan a los diferentes candidatos. Tengamos en cuenta que partimos de valores negativos en pre-campaña, y lo que sucede es que simplemente los valores empeoran en periodo de campaña. Este hecho refuerza la tesis de que los partidos políticos han apostado por acciones de desprestigio contra la oposición, y que la opinión pública representada en Twitter ha reaccionado en esa misma línea.

Sentimiento por candidato (valores absolutos)

El volumen con polaridad (positiva o negativa) ha sido directamente proporcional al volumen de menciones recogidas (a más menciones, más menciones con polaridad de algún tipo). Para dar cierta perspectiva a este dato, cabe comentar que al hacer este mismo análisis con productos o marcas comerciales, lo habitual es que la carga de polaridad no supere un 20% del total de los artículos publicados, siendo mayoritariamente neutrales, y en muy pocas ocasiones (salvo crisis flagrantes) las marcas tienen balances de 10 comentarios negativos por cada 1 positivo. Sin duda alguna, el periodo de campaña es un periodo realmente hostil en términos de comunicación.

Sentimiento por partidos políticos

Sentimiento por partido (valores absolutos)

Desde la perspectiva de los partidos políticos, los nuevos partidos han logrado un mejor cómputo global (en parte justificado por su propio dominio sobre la conversación política en esta plataforma). El Partido Popular, siendo el rival a batir, ha sido quien más críticas ha acumulado. Unidos Podemos ha generado con su aparato de campaña multitud de contenido propio, una parte de él relativo a su programa de ahí que obtuviese una mayor proporción de contenido neutral.

La jornada de reflexión es cosa del pasado.

Simplemente no se respeta, al contrario, la campaña se concentra en medios sociales imposibles de regularizar en este sentido.

Publicaciones alusivas a los distintos partidos durante la jornada de reflexión del 26J

A pesar de no respetarse la jornada de reflexión en medios sociales, el descenso de actividad en otros espacios web y en otros canales tradicionales, si ha tenido cierto reflejo en el volumen global de conversaciones sobre las elecciones, representando el volumen más bajo desde el inicio del periodo oficial de campaña, para posteriormente proyectarse a lo más alto durante el día de las elecciones y el día posterior, para de nuevo caer hasta cotas similares a periodos pre-electorales, a pesar de no haberse constituído gobierno todavía, y continuar una intensa actividad política.

Tendencia de conversación sobre los partidos políticos durante la campaña del 26j

Cabría una reflexión en este punto: tras las elecciones, a pesar de ser necesaria una intensa actividad política, no se ha buscado la participación de la ciudadanía en esta. Los motivos pueden ser muchos, y no es objeto de este estudio especular sobre ellos, más allá de apuntar el hecho en sí.

¿Podemos hablar de expectativas autogeneradas?

La sombra del fraude electoral ha estado presente en los días posteriores a la publicación de los resultados. Lo cierto, es que los resultados se han escapado de cualquier tipo de previsión realizada a través de sondeos, encuestas o incluso a través de las percepciones individuales de cada uno de nosotros, hecho del que ya se ha discutido en la prensa abundantemente.

En un intento de explicar este fenómeno de discordancia entre expectativas y resultados, hemos identificado al menos dos posibles causas (seguramente habrá muchas otras), que quizás se puedan ilustrar desde la óptica de la comunicación en redes sociales:

  1. Las comunidades en torno a los partidos se retroalimentan a sí mismas.
  2. La relativización de los resultados por causa de la Ley D’HOnt.

Las comunidades en torno a los partidos se retroalimentan a sí mismas

El espacio de conversación generado por las opciones políticas afines, se convierte en la única realidad visible para quienes la integran.

Cuestiones técnicas como son el paso de la relevancia cronológica al nuevo algoritmo de “relevancia por afinidad” de Twitter, ha contribuido a alimentar ese “you-loop” informativo en el que todo lo que te rodea te ofrece lo que quieres escuchar.

Para analizar este hecho, hemos representado en un gráfico (grafo) las historias más importantes sobre los diferentes partidos y hemos calculado la posición que ocupan en el espacio vectorial en base al número de fuentes/usuarios que han participado en ellas, de manera que cuantos más usuarios tengan en común, más próximos están los nodos que representan a cada historia.

Para facilitar su interpretación, ten en cuenta que:

  • Los colores representan a los partidos políticos
  • El tamaño de los nodos el volumen de tweets que contiene cada historia (recuerda que una historia representa un conjunto de tweets que hablan de lo mismo).
  • La distancia entre nodos, es inversamente proporcional al número de fuentes en común que han participado en ambas historias.
Grafo que muestra las historias que tratan sobre los distintos partidos y el volumen de artículos que las forman

Lo primero que salta a la vista, es la bajísima presencia de partidos minoritarios, agrupados en color gris (en gris). En este conjunto estarían partidos como PACMA (el más activo de este subconjunto), VOX, UPYD… es decir todos lo que no son Podemos, PP, PSOE o Ciudadanos.

Lo segundo que llama la atención, es cómo se agrupan la mayor parte de las menciones a PSOE y Cs, casi como conjuntos independientes al PP y Unidos Podemos.

Y por último, y no menos importante, salta a la vista la intensa interacción existente entre fuentes Podemos y PP, cuyas historias comparten una buena parte de fuentes. Dicho en otras palabras, muchos de los que han hablado de Unidos Podemos también lo han hecho sobre el Partido Popular o viceversa (¿recuerdas lo que decíamos de la “anticampaña”?).

Al procesar este mismo grafo con nuestro algoritmo de detección de sentimiento (construído con tecnologías deep learning, para el cual hemos aportado un entrenamiento con análisis humano de aproximadamente unas 5000 menciones, las cuales extrapolamos posteriormente a los 15 MM de menciones recogidas), obtenemos la siguiente imagen:

Grafo que muestra el sentimiento de las historias y su volumen

El código de colores es rojo, verde y gris para representar, valores negativos, positivos y neutrales respectivamente.

Si atendemos por ejemplo al espacio que ocupaban las conversaciones de PSOE y Ciudadanos, vemos un elevado porcentaje de contenidos positivos o neutrales, lo que nos sugiere la existencia de una comunidad afín a estos partidos en el núcleo de conversación sobre los mismos.

Por el contrario si atendemos al espacio conversacional, más intenso sobre PP y Unidos podemos vemos que el entorno del núcleo conversacional es marcadamente hostil. En especial en el caso del espacio conversacional del PP. Esto unido a la proximidad espacial a menciones positivas a Podemos, nos sugiere, que ese espacio conversacional hostil, en caso del Partido Popular, tiene una fuerte intervención del fuentes afines a Unidos Podemos.

Grafo con detalle de historias

La ironía es un rasgo especialmente abundante en la cultura latina. Un comentario aparentemente humorístico o como “Atención al momentazo #fijoquemanchan…” esconde un nada inocente ataque a un candidato. En este caso, los algoritmos de análisis de sentimiento tienen pocas opciones de acertar, ya que el texto en sí es positivo, pero tras las palabras se esconde una apelación al racismo. Es en este tipo de comentarios los que suponen un mayor reto tecnológico, ya que son manifestaciones creativas y espontáneas del lenguaje, que incluso un humano sólo puede comprender si conoce el contexto determinado en el que se han producido.

Este gráfico delata al entorno del Partido Popular (posiblemente contando con cierta complicidad del entorno de Unidos Podemos), como el máximo responsable de la acción de desprestigio al candidato socialista, en torno a una imagen en la que se limpiaba la mano tras tocar a un niño de color.

También es significativa la posición de la reacción de Pedro Sánchez, totalmente alejada del entorno conversacional de esa acción en su contra, lo cual es un claro síntoma de falta de capacidad para influir sobre esa acción de desprestigio.

Grafo con detalle de historias

El humor, es uno de los recursos más poderosos a la hora de generar viralidad sobre un tema determinado, y los aparatos propagandísticos de los partidos lo saben y lo usan profusamente. Este hecho, ha llevado a esperpénticas situaciones, en las que en unos días hemos podido ver a las mismas fuentes pivotar de sobrepasar los límites del humor a la reivindicación más seria.

Quizás esto sólo le interese a los analistas de medios sociales: Detección de comentarios off-topic (=fuera del foco de análisis). Para quien se dedique a esto, tener una herramienta potente con la que eliminar ruido, es clave para centrar el esfuerzo analítico. Este tipo de grafos permite a golpe de vista identificar esos contenidos que “pertenecen a otro cuento”:

Grafo como herramienta para el filtrado masivo de conversaciones Off Topic

La metodología de análisis que usamos descansa en gran medida en la identificación de palabras clave que nos permiten diferenciar la información que nos interesa de los datos que no son útiles para nuestro estudio, pero como toda técnica, tiene sus limitaciones.

Desde el punto de vista del analista de medios sociales, una campaña electoral es posiblemente el escenario más complejo posible, entre otras cosas por la ambigüedad de los términos con los que se definen los propios partidos: unidos, podemos, partido, popular, ciudadanos….

Desde el punto de vista tecnológico, hemos detectado un interesante fenómeno al representar las historias en grafos. Se trata de la representación dispersa de historias off topic. Esto tiene una importancia capital en la capacidad de filtrar elementos que no pertenecen al ámbito de estudio, navegando a través de grafo. Dicho en otras palabras, las historias que se alejan del conjunto principal, posiblemente sean ruido. Y poder separar el ruido del contenido importante, con tanta facilidad multiplica exponencialmente nuestra capacidad de análisis. En la práctica, podemos eliminar decenas de miles de publicaciones sin ni siquiera leerlas simplemente viendo el lugar que ocupan en el gráfico. Sinceramente, supone una capacidad de filtrado sin precedentes.

La Ley D´Hondt y su efecto sobre la relativización de los resultados

La ley electoral española contiene una aberración que en su día se consideró el mal menor para dotar de representación a territorios más pequeños. Este método da lugar a importantes discrepancias entre el nº de votantes obtenidos y el nº de escaños, que tradicionalmente han beneficiado a los grandes partidos y a algunos nacionalistas, limitando el acceso de nuevos players, como por ejemplo PACMA o Ciudadanos, que ha sido el partido más castigado por este modelo.

Discrepancia entre % de votos y % de escaños recibidos por los distintos partidos en el 26J

Si tenemos en cuenta otro hecho objetivo, y que no es exclusivo del sistema democrático español: el partido más votado no tiene porque ser es el que vota la mayor parte de la población. De hecho, la mayoría claramente ha votado otra opción política diferente (15.850.489 han votado a otro partido diferente al Partido Popular, lo cual representa el doble de votos en contra). Este hecho, sin duda contribuye a la percepción de dominancia de la alternativa al Partido Popular en la opinión pública. Ya que en el concepto de “alternativa” encajaría la suma de esas opciones e incluso la de quienes no optan por ninguna.

Llevando este hecho, al análisis que nos ocupa, si a esto sumamos el perfil “tipo” de usuario de Twitter, socio-demográficamente alejado del perfil tipo del votante del Partido Popular, nos encontramos con un escenario perfecto para que se generen elevadas expectativas a favor del cambio de turno en el gobierno, unas expectativas que no se han cumplido, y que justifican el hecho de que Twitter, que fue el campo de batalla dominado por la nueva izquierda, no haya sido una fiesta el 26J.

--

--