Investidura wordcloud

Hoy es otro de esos días en los que decido aprovechar el tiempo más de lo habitual. Y, aprovechando la coyuntura electoral en la que estamos metidos, me he puesto a analizar un poco los discursos de los políticos en la sesión de investidura de hoy.

Así, tras unas cuantas horas de picar código, ha salido otro mini-proyecto: Investidura Wordcloud. Un pequeño script en Python que, a partir de un documento en PDF que contenga los discursos de los políticos, genera una nube de tags representando las palabras más mencionadas en los mismos. Y así, salen cosas como estas:

Wordcloud de Rajoy
Wordcloud de Sánchez

(Sólo he encontrado los discursos en PDF de Rajoy y Sánchez, pero en cuanto encuentre los demás los voy añadiendo también)

Aún queda mucho que pulir, como excluir las palabras de las cabeceras de los PDF o poder analizar texto Unicode, pero sin duda el resultado ya permite lo que al fin y al cabo es la finalidad del script: ver qué nos cuenta cada uno.

Puede encontrarse el código completo en mi Github (https://github.com/AlexGascon/Investidura-wordcloud), por si alguien le quiere echar un vistazo (¡o incluso contribuir!). ¡Cualquier sugerencia es más que bienvenida!

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.