Analizando el #NiUnaMenos en las redes

Un abordaje de redes y grafos

¿Por qué un grafo de #NiUnaMenos?

Ni Una Menos es un evento de proporciones, tanto en la calle como en las redes. Sigue siendo un tema controvertido, que genera distintas percepciones, opiniones, puntos de vista, intercambios e interacciones digitales. Estos intercambios entre actores digitales pueden observarse muy claramente en twitter. Nuestra intención es analizar cómo los diferentes actores en la marcha (y fuera) interactúan entre sí, encontrar los rastros de afinidades, conflicto y crisis que genera #NiUnaMenos y que, inevitablemente, se filtran en twitter y redes sociales. Por este motivo, recolectamos toda la actividad en Twitter del día 3 de junio, relacionada a dicho hashtag, para aplicarle un análisis de redes.

¿Qué es un grafo, cómo funciona?

Un grafo es una red, que está formada por Nodos y Conectores. Los nodos pueden ser cualquier cosa, personas, usuarios de twitter, genes, etc. y las aristas son las relaciones que estas “cosas”/nodos tienen entre sí.

De las relaciones entre nodos en una red se pueden hacer un montón de análisis como quiénes son más afines, quiénes se relacionan más, quiénes por el contrario no se relacionan, si se pueden identificar grupos concretos agrupados en comunidades (barrios digitales), referentes, etc. Este análisis de los grafos, se llama Network theory y tiene una gran aplicación al análisis de redes sociales.

El Grafo de #NiUnaMenos

Nos pusimos a jugar. Esto nos juntó a todos nosotros, los que hacemos este análisis. Un colectivo de distintas profesiones en un mismo equipo. La base está: partimos de un análisis similar realizado el año pasado. Finalmente nos inclinamos por el grafo que pueden ver al principio de la nota (ver en alta definición aquí). Nos pareció el más representativo. Y el más jugoso.

En él pueden verse puntos (círculos) de colores, conectados entre sí por líneas.

Cada círculo es un nodo,un usuario de Twitter. Las líneas son relaciones y vínculos entre esas cuentas, ya sean menciones específicas a usuarios o RT’s. Un ejemplo cotidiano: si el usuario @C5N menciona a @CFKArgentina se traza una línea entre ellos dos. Si un usuario retuitea a otro, también se los conecta con una línea.

Los colores, por su parte, definen grupos de usuarios que se mencionaron mucho entre sí. Acá aparecen los barrios digitales: las comunidades que se construyen en torno a las menciones y conexiones. Un desafío para los daltónicos. Estos usuarios que se vinculan pueden discutir, o apoyarse, estar de acuerdo o en desacuerdo . Independientemente de las posturas en torno a los mensajes que cada uno emite, la relación se forma igual.

(Para ver el análisis del contenido de lo comentado en las redes, hay otras notas mejores)

Por último, los usuarios tienen nombres específicos y éstos tienen un tamaño determinado. Dependiendo de cuán importante sea el usuario en el grafo será más grande, más pequeño o ínfimamente irrelevante. Para determinar esa relación de poder utilizamos el algoritmo de Page Rank antes mencionado.

A partir de este grafo sacamos algunas conclusiones tentativas, intentando proveer evidencias para abrir el debate mas que para cerrarlo.

Aclaración:
Este ejercicio sólo se propone analizar los datos obtenidos. Toda conclusión a la que lleguemos mediante este método de análisis es inductiva y acotada. El principal sesgo es que solo estamos viendo interacciones en twitter que utilicen las palabras clave elegidas. No se tienen en cuenta ni factores externos a la red social, ni casos particulares, ni se analiza lo que dicen los tweets.

Conclusiones

El centro
En el centro del grafo vemos encontrarse dos clusters importantes. El verde, grupo influenciado principalmente por @CFKArgentina y otros que principalmente adscriben al kirchnerismo en las redes, y el Violeta, que se ve fuertemente influenciado por tendencias “anti-k”, con @“NunkMasKs como principal influyente.

Seccion central del grafo

Aquellos usuarios que se encuentran en el encuentro de estos dos grandes grupos, son ubicados aquí por el algoritmo de clustering ya que fueron mencionados/retuiteados por usuarios de ambos grupos (verde y violeta). Es interesante ver cómo esta zona es habitada por las primeras impulsoras de aquel NiUnaMenos de 2015, las periodistas @fetcheves, @MarcelitaOjeda, @soyingridbeck, @solevallejos y otras. Algunas figuran más cerca de @todonoticias, como Florencia Etcheves y Valeria Sampedro (ambas trabajan en ese medio), otras mas cercanas a C5N y Pagina12 como Luciana Peker o Angela Lerena. Los medios conectan los barrios en los márgenes.

Es interesante el caso de @fenomenoide, que publicó una imagen con los rostros dibujados de cada víctima de femicidio de 2017. Se ve un cluster propio, desconectado de los otros, que puede indicar que muchos usuarios retuitearon su imagen sin necesariamente haber conectado demasiado con el resto de los usuarios o grupos.

Curiosidades
Como mencionamos antes, el algoritmo no analiza más que interacciones y “fuerzas”, por lo que es incapaz de comprender si esas interacciones son positivas o negativas. Casos para analizar son, por ejemplo el de @FilmusDaniel, que aparece inmerso en un cluster opuesto al kirchnerismo, y más cercano al massismo, lo cual no coincide con lo que supondríamos a priori.

Sección central del grafo

Asimismo, encontrar a @mauriciomacri o @mariuvidal tan cerca de @cfkargentina nos indica que en el caso de #niunamenos no se replica la afamada grieta Kirchnerismo-Macrismo

En el cluster naranja, identificado principalmente por el massismo, vemos como Malena Massa tiene más importancia que Sergio, probablemente por su militancia sobre la paridad de género en el congreso, lo que la hace además el puente para vincularse con otros clusters, en este caso más con el violeta (anti-k) que el verde (k)

La ubicación de @clarincom queda a criterio de los lectores. La única pista que les dejamos: su poca importancia comparada con otros medios.

La periferia
En la periferia del grafo, veremos usuarios con impacto, pero poco interconectados con el resto del ecosistema.

Sección periférica del grafo

Connieansaldi, comentarista de chimentos, parece haber tenido gran impacto, pero sobre usuarios no relacionados con todo lo demas. El algoritmo la ubica en este sector de la periferia, por compartir más interacciones con el cluster violeta (“anti-k”) que con los otros.

Los Trolls (no confundir con Bots)

En la jerga de internet, llamamos troll al que busca incansablemente molestar a quienes argumentan algo, intentando refutarlo aun sin tener argumentos reales. Casi un bullying digital.

En el caso del #NiUnaMenos, tenemos la contraparte #NiUNOMenos que suele surgir por contraposición y buscando contraargumentar el objeto del primero.

A continuación, vemos el grafo donde solo graficamos el #NiUnoMenos:

Grafo obtenido de analizar solo el hashtag #NiUNOmenos

Vemos aquí que los principales influenciadores de este grafo son cuentas sin nombres propios y de las que pocas veces se conoce/n su/s autor/es. También vemos que muchos son los que en el grafo original se encuentran influenciando fuertemente el cluster violeta, lo que nos puede indicar que probablemente estaban utilizando el hashtag #niunamenos pero criticándolo.

Los Bots (no confundir con Trolls)

Pese a que muchas veces se los nombra indistintamente, los Bots y los Trolls no son lo mismo. Aunque a veces no lo parezca, los Trolls son humanos. Los Bots, son usuarios de tuiter que en vez de ser manejados por un humano, son administrados por un programa informático, que intenta hacer que se comporten como humanos, tuiteando y siguiendo a otros usuarios. Se los reconoce normalmente por tuitear al unísono con otros exactamente el mismo mensaje, o tener perfiles claramente artificiales.

Acá podemos ver un buen ejemplo: los Bots de la “Betty” Rokjes (esposa de José Alperovich, ex gobernador de Tucumán), que dijo en su momento “la violencia se da de a dos”. Podemos ver como los bots, creados todos a la vez, siguen en cardumen a su líder:


Anexo Metodológico

  • 29.821 Nodos (twitteros)
  • 57.256 Relaciones (RT o Mentions)

Hacer este trabajo no es tan sofisticado ni tan complicado como parece. Existen diversas herramientas en la web que permiten hacer análisis de este tipo en tiempos cortos. Describimos un poco que usamos para que otros puedan sumarse y generar contenido.

Recolección de los datos

Para la recolección de los datos, usamos una librería muy popular de python Tweeppy que pueden descargar acá: https://github.com/tweepy/tweepy/ o directamente usando pip install si tienen conocimientos de python. Esta librería permite, entre otras cosas, capturar la totalidad de los tweets sobre uno o más hashtags siguiendo el streaming directo de twitter. Pueden descargar el script utilizado acá (o mejorarlo) link!! (ya lo agregaremos con el repo de github, paciencia)

Pusimos a descargar todos los tweets durante 12 horas, antes y después del evento y nos quedó algo como esto:

Los campos principales son:

  • Origen: usuario que emite el tweet
  • Destino: Usuario/s que son Mencionados o Re-tweeteados en el tweet.

Los usuarios serán nodos (Circulitos en el gráfico) y los RT/Mentions serán relaciones (Lineas).

De este modo cada usuario se considera un Nodo, y cada mención o RT una relación entre estos nodos. Por ejemplo, si el usuario A menciona al usuario B en un tweet, se establece que existe una relación entre A y B.

Las relaciones entre los usuarios A, B, C, n usuarios, configuran el grafo general, y sobre este grafo es donde realizaremos el análisis.

Análisis

Para el análisis no inventamos la pólvora, sino que usamos algunos algoritmos que se utilizan mucho ya en este tipo de análisis, particularmente aquellos que vienen incluidos como Plugins en Gephi o Cytoscape.

Para este proyecto usamos la herramienta Open source Gephi que pueden descargarse acá: https://gephi.org/.

Con Gephi realizamos los siguientes Tareas

  1. Distribuimos los Nodos (twitteros) en el espacio (grapho) usando un algoritmo de fuerza dirigida (Force Atlas). Estos algoritmos, lo que hacen es asignar un peso a cada relación, basado en la cantidad de tweets para después “equilibrar” el gráfico ubicando cada nodo (circulito/twittero) a distintas distancias del resto de acuerdo a la cantidad de interacciones que tienen entre sí.

Grafo con y sin distribución:

2. Relevancia de los nodos: existen distintas formas de calcular la relevancia de un nodo/usuario dentro de la red. La más simple es simplemente contando la cantidad de relaciones que tienen con otros usuarios. El problema acá, son los “bots”, es decir un usuario poco relevante podría comprar un montón de cuentas falsas que lo retwiteen, para ser más relevante en la red. Para evitar esto, lo que se hace es calcular la importancia de un usuario en la red basada en la cantidad de relaciones y la importancia de cada uno de los otros usuarios con los que se relaciona. Estos algoritmos son muy parecidos a los que se usan en los buscadores (por ejemplo google) para determinar qué sitio debe aparecer primero en las búsquedas. En este caso usamos un algoritmo que emula el creado por Google (https://es.wikipedia.org/wiki/PageRank)

Grafo anterior usando PageRank para determinar la relevancia de los nodos:

3. Finalmente, aplicamos un algoritmo de clustering, estas son funciones que permiten identificar comunidades dentro de un grafo, grupos de usuarios que por una razón u otra se asemejan, conversan entre sí y tienen más relaciones entre ellos que con el resto. (ojo, estas relaciones pueden ser amistad o de odio, lo que importa es que conversen mucho). Existen infinidad de formas de hacer esto, todas son imperfectas. En nuestro caso usamos un algoritmo que ya viene incluido en Gephi: “Modularity” (https://github.com/gephi/gephi/wiki/Modularity) y coloreamos los “grupos/clusters” por afinidad.

Ejemplo de Clusters

El resto del trabajo es esperar ;), cuando son tantos datos nodos y relaciones el procesamiento es largo y hay que tener paciencia.

A los que quieran introducirse en este mundo, bajense Gephi (es gratis) y investiguen los tutoriales: https://gephi.org/users/

Glosario:

Scraping — Obtener información de una página web aunque ésta no esté preparada para ello. En este caso, obtener todos los tweets con ciertas palabras o hashtags

Hashtag — Palabra o frase sin espacios utilizada en redes sociales para identificar un tema. En twitter, comienza con el signo # y cuando cierto hashtag se repite lo suficiente, aparece como tendencia

Redes — Redes sociales como facebook, twitter o instagram. En este caso, twitter

Clustering — Unir elementos por afinidad.

Page Rank — Algoritmo para ponderar resultados en busquedas. En vez de basarse solo en una variable (cantidad de tweets, por ejemplo) podemos ponderar un usuario dependiendo de la cantidad de seguidores, o de quienes son esos seguidores. Ej: Un usuario tiene un page rank mas alto si lo sigue Obama, que si lo siguen 1000 personas con pocos seguidores

RT — ReTweet. Cuando un usuario de twitter comparte con su red un tweet de otro usuario. Normalmente implica estar de acuerdo o querer difundir lo que dice el tweet.

Followers — seguidores que tiene un usuario en la red social. No necesariamente el usuario sigue a sus seguidores.


Créditos de esta nota:

Grafos:
Franco Bellomo @fnbellomo, Lucas Bellomo @ucaomo, Antonio Milanese, Martín Szyszlican y @ogianatiempo

El presente análisis:
Antonio Milanese, Facundo Cruz, Lara, Paula Clerici, Martin Alalu, Martín Szyszlican y Andres Snitcofsky

Observatorio de redes:
Conforman un equipo multidisciplinario no porque esté de moda, sino porque nos llevamos bien. Trabajamos en distintos ámbitos y nos nucleamos en torno a la @OKFNAR y al @O_de_R, los antes citados más

El Observatorio de Redes es una iniciativa impulsada por @CIPPEC, @CoalicionesGICP y BASTION Digital

http://ar.bastiondigital.com/blog/observatorio-de-redes