Cada palabra, cuenta: analizando a Pedro Sánchez durante el Estado de Alarma.

Hemos vivido, y estamos viviendo, una época que, sin temor a exagerar, no tiene sin precedentes en nuestro contexto y la cual, aunque tratamos de evitar a toda costa, es bastante probable que tengamos que revivir en algún punto del futuro. Esta situación merece un análisis que permita ver el sentimiento que se ha trasmitido.

Estefanía Agüero-Merino
cultudata
Published in
7 min readDec 12, 2020

--

De cara al futuro, no podemos afirmar que vayamos a estar más preparados o vayamos a ser más precavidos, algunas situaciones no serán lo excepcionales que han sido en esta pandemia. Entre ellas: el estado de alarma. Tras su declaración el 13 de marzo, las comparecencias de Pedro Sánchez se sucedieron de una forma tal, que con la frecuencia que veíamos a nuestros amigos, familiares, allegados y camareros, comenzamos a ver a Sánchez en nuestro hogar como uno más.

Marzo, abril y mayo fueron unos meses de gran intensidad en lo que a las comunicaciones gubernamentales con la ciudadanía respecta. No había día sin que algún miembro del Gobierno se dirigiera a la población para comunicar como evolucionaba el estado de la pandemia, y el presidente Sánchez se dirigió a la ciudadanía en las siguientes ocasiones, desde diferentes escenarios pero con la misma motivación: la pandemia y la evolución y alcance de esta.

Intervenciones de Pedro Sánchez en los meses de marzo, abril y mayo:

Calendarios de abril, mayo y junio de 2020, que muestran los días en los que Pedro Sánchez se dirigió la ciudadanía.
Elaboración propia con los datos facilitados por: Gobierno de España — Presidencia del Gobierno.

Como se puede ver, en los tres meses de Estado de Alarma estricto no pasó una semana sin que no compareciera Pedro Sánchez, siendo marzo el mes que más se dirigió al público –y de forma más frecuente–. La media de intervenciones de estos tres meses fue de siete apariciones al mes, y como máximo transcurrieron seis días entre una comparecencia y otra, fuera del tipo que fuera. Llegaron a tener lugar cuatro apariciones del Presidente en una misma semana, algunas en días consecutivos, en los momentos de mayor incertidumbre.

Lo que se realiza a continuación en este artículo es un análisis de las palabras usadas en cada intervención que tuvo lugar durante estos meses, por la excepcionalidad de aquellos días extraños, de confinamiento e incertidumbre. El objetivo es ver, gracias a las técnicas de procesamiento del lenguaje natural –no supervisadas– cuál es el sentimiento de esas intervenciones. ¿Dominaba la cantidad de palabras negativas o positivas?.

Y si cada palabra tiene una puntuación de positividad/negatividad… ¿qué es más fuerte? ¿la negatividad o la positividad?. Si hay más palabras negativas o positivas, si la puntuación es mas fuerte hacia un sentimiento u otro; contextualizando todo esto en el tiempo, es lo que puedes ver a continuación. El sentimiento puede percibirse de muchas maneras, veamos qué dicen los datos y el análisis no supervisado sobre las intervenciones durante el Estado de Alarma.

Consejo: ¿Lees esto desde un móvil? Clicka sobre los gráficos, para poderlos ampliar y ver con detalle.

Puntuación de las palabras categorizadas.

Según el diccionario empleado en esta gráfica, la puntuación va de -5 –palabras muy negativas– a 5 –palabras muy positivas– representando el cero el no dominio de un sentimiento sobre otro (neutralidad).

Los colores de cada caja se corresponden con los tipos de intervenciones diferenciadas en el calendario mostrado arriba. Elaboración propia con los datos facilitados por: Gobierno de España — Presidencia del Gobierno.

Tips (de andar por casa) para entender este gráfico: Mira la línea que parte cada caja ¿dónde cae? ¿zona positiva o negativa?. Este gráfico muestra como son las puntuaciones de las palabras clasificadas dentro de cada intervencion. Cada cajita, una intervención, cada punto verde/rojo, una palabra. Por ejemplo: el diccionario que se ha usado dice que la palabra alarma tiene una puntuación -2 de negatividad y en esa línea aparecerá el puntito que representa a alarma en la intervención que se mencione. La línea de la caja es la mediana, el valor que deja a la mitad de palabras/puntitos/casos a un lado y la mitad al otro. Si se ubica claramente en una parte podemos hablar de mayor peso de unas puntuaciones u otras ¿si estuviera en el centro/0? Neutralidad. Hay tanta puntuación negativa, como positiva. Pero aquí no lo veremos.

El análisis –en una narración simple– coge las palabras del debate y según el ejemplo que se le da –un léxico con puntuaciones asignadas a cada palabra– va clasificando las palabras. Así, para cada palabra de cada intervención; para cada intervención durante los meses analizados: alegría, 2 puntos; muerte, -3, triste, -2, feliz, 3…. y así consecutivamente. Las palabras sin sentido claro no se recogen.

Un tip aclaratorio ¿Por qué hay puntos en zonas intermedias si las puntuaciones no son decimales?: Esos puntos dispersos permiten ver, con más claridad cuantos puntos/palabras hay en la zona, en vez de acumularse solo en su línea de puntos (ej: -2) se dispersan en y alrededor de esta. La visión de estos datos así es mucho mejor.

La línea de la mediana la encontramos en 21 de las 23 intervenciones en la zona de puntuaciones negativas, indicativo de que con claridad las palabras eran negativas y las puntuaciones de las positivas, por altas que fueran, no conseguían arrastrar la puntuación ni siquiera a la neutralidad: las palabras negativas dominaron el discurso general de la pandemia.

Proporción de palabras positivas-negativas.

¿Cuántas palabras positivas / negativas aparecen en cada intervención porcentualmente?

En verde se representa el porcentaje de palabras clasificadas como “positivas” y en rojo las categorizadas como “negativas”. Elaboración propia con los datos facilitados por: Gobierno de España — Presidencia del Gobierno.

Se ve como la negatividad dominó como una dinámica general, y no es de extrañar: las circunstancias conducían a emplear términos con connotaciones muy negativas –muertes, cerrar, virus–, porque el propio contexto era negativo. No obstante, hay dos días en los que la positividad domina: el día 14 de marzo, cuando se declara el Estado de Alarma y el 31 de mayo, cuando se clarifica el fin de este y todo conduce a ese impás estival de nueva normalidad.

El 13 de marzo y el 12 de abril cuentan con una presencia de palabras negativas muy fuerte, alrededor del 70–65 por ciento respectivamente. La gravedad sobrevenida del primero, y el momento intermedio de incertidumbre en lo que era el ecuador de la pandemia hacían que los términos negativos ganaran peso y protagonismo.

Solo hubo un discreto dominio de la positividad dos días, uno obvio y otro en el que se podría pensar que era más negativo. El día 14, cuando la situación seguía estallando para todo el mundo, remontaba la negatividad del día anterior –cuando se declaró el Estado de Alarma–. Seguramente se deba a que dentro del mensaje negativo, también se apelaba a ser fuerte, a continuar y a que todo el esfuerzo era para un fin mayor. A partir de ese día, la negatividad domina claramente y solo se volverá a ver un repunte de la positividad el día 31, el que se perfila como principio del fin de la pandemia.

Palabras a las que volver:

De todas las palabras usadas, algunas aparecían esporádicamente, otras eran más significativas que otras, y algunas, aunque acaparan mucho protagoismo, aparecen esporádicamente. A continuación, las más repetidas:

Las 50 palabras más repetidas.

Clasificación de las 50 palabras más repetidas en las 23 intervenciones analizadas entre marzo y mayo. Elaboración propia con los datos facilitados por: Gobierno de España — Presidencia del Gobierno.

Tips (de andar por casa) para entender este gráfico: Aquí es donde se puede ver el limitado alcance de los lexicos empleados para este fin en español: su capacidad de clasficación es limitada. Hay que pensar que el lenguaje se enriquece por las ironías, giros, dobles sentidos, etc., que una sola palabra de forma aislada no puede recoger. “Situación” puede ser positiva, negativa o neutra, y ante esta ambigüedad, lo mejor, es optar por mantenerlas neutras y resaltar y cargar el análisis en los términos que claramente tienen una connotación u otra.

Cuando se hace referencia a las palabras más repetidas, no todas ellas, como es este caso, pueden etiquetarse como positivas o negativas, solo una parte de todas las palabras empleadas tiene, de forma inequívoca –en la generalidad de los casos– un sentido. Como se puede ver, los términos en color amarillo corresponden con las palabras neutrales, y estos son los más abundantes. “España” y “Gobierno” son los términos que más veces aparecen y aunque si aparee la palabra “virus” (en tercer lugar), no hay rastro del término coronavirus entre las 50 palabras más usadas. Si aparece covid, en el 38º lugar, porque con seguridad no era tan necesario usar este termino cuando el contexto ya nos imprimía su presencia constante en el discurso. Se repite más “emergencia” que “sanidad” o “sociedad”, y también “medidas” que “consecuencias”. Cabe señalar que hay muchas palabras que, valorando de una forma subjetiva y contextual, sabemos que implican positividad como los verbos “vamos” o “hacer”; un desiderativo como “quiero”, en 23º lugar, seguido de “ser” nos muestran el carácter calmante de muchas referencias del presidente hacía los ciudadanos. Una demostración que tener el control y la capacidad de acción entre la negatividad.

Conclusiones.

Como se ve, aún con léxicos que sería deseable fueran más perfectos, se encuentra en las palabras de Sánchez un reflejo muy adecuado de qué se trasmitía, sin leerlo ni adjuntando al análisis percepciones sensibles. Los datos muestran de forma muy adecuada como fue el sentimiento en las intervenciones del Presidente del Gobierno: negativo, exceptuando cuando se necesitó de una manifestación de ánimo y en la recta final de la primera parte de la pandemia.

Fuente de datos: https://www.lamoncloa.gob.es/presidente/intervenciones/Paginas/index.aspx

Datos técnicos:
Léxico: Afinn. Dataset publicado por Finn Ärup Nielsen (2011), “A new ANEW: Evaluation of a word list for sentiment analysis in microblogs”, Proceedings of the ESWC2011 Workshop on ‘Making Sense of Microposts’: Big things come in small packages (2011) 93–98.

Las palabras “covid” así como “coronavirus” no se encuentran recogidas en el léxico empleado ni se han incorporado, ya que aún teniendo una clara connotación negativa la neutralidad era mayor manteniendo el diccionario sin esta modificación.

Realizado con el programa RStudio.

Aclaraciones:

Los tips ofrecidos arriba son un resumen de una teoría mucho más extensa. Si te interesa saber más sobre las técnicas, librerías, datos…, no dudes en hacérnolo saber.

--

--

Estefanía Agüero-Merino
cultudata

Politóloga, analista de datos y amante de todo lo cotidiano.