Mon réseau Twitter décortiqué

Partie 3 — Visualisation des liens entre mes followees et des communautés avec Gephi

Avant de continuer, je vous invite à lire les deux premières parties :

Rappels des données

  • J’ai 395 followees sur Twitter
  • Le fichier utilisé pour l’analyse recense 398 noeuds (followees) et 8 183 liens
  • La densité du réseau est de 5,1 % (elle serait de 100 % si toutes les personnes de mon réseau se suivaient mutuellement)
  • En moyenne, chaque personne suit et/ou est suivie par 20,56 autres personnes (le degré moyen)
  • Le chemin le plus long entre deux noeuds est de 7 liens (le diamètre du réseau)
  • Et le chemin moyen de 2,54 liens (le diamètre moyen)
  • La modularité de mon réseau est de 0,36
  • L’algorithme de détection de communautés en trouve 6

Note pour la suite : un lien représente toujours une relation de followee. Dans un réseau dirigé (comme Twitter), on représente par convention un lien de suivi par une courbe dans le sens des aiguilles d’une montre.

Algorithmes de dessin basé sur les forces

Petit rappel de Wikipédia :

Les algorithmes de dessin basé sur les forces (Force-based ou Force-directed algorithms) permettent de positionner les nœuds d’un graphe pour faciliter sa visualisation en utilisant un système de force appliqué entre les nœuds et les arcs.

Fruchterman Reingold

Commençons avec l’algorithme de Fruchterman Reingold, un peu obsolète mais qui donne déjà une bonne visualisation des communautés.

T.M.J. Fruchterman and E.M. Reingold introduced a “global temperature” that controls the step width of node movements and the algorithm’s termination.

Ici avec la taille des noeuds proportionnelle au degré entrant

On a donc ici une vue relative à mon réseau…

Et là, proportionnelle au nombre de followers

…Alors qu’ici, les données sont absolues

Note : La taille des noeuds est effectivement proportionnelle (linéaire et monotone) au nombre de degrés entrants dans le réseau ou followers absolus. Par ailleurs, Gephi propose différentes échelles de visualisation pour mettre en valeurs les très gros par exemple.

À gauche, le modèle de représentation utilisé ici

Yifan Hu

L’algorithme combine un modèle de force dirigée par une technique graphique de grossissement (algorithme à plusieurs niveaux) pour réduire la complexité. Les forces de répulsion sur un nœud d’un cluster de nœuds distants sont approchées par un calcul Barnes-Hut, qui les traite comme un super-nœud. Source

Ici avec la taille des noeuds proportionnelle au degré entrant

Sans les labels

Et là, proportionnelle au nombre de followers

On retrouve sensiblement la même visualisation qu’avec l’algorithme de Fruchterman Reingold

Force Atlas 2

Voici l’algorithme de spacialisation le plus intéressant de Gephi quand on souhaite représenter des réseaux de petite et moyenne taille et en mettant l’accent sur les communautés.

ForceAtlas2 is a force-directed layout close to other algorithms used for network spatialization. We do not claim a theoretical advance but an attempt to integrate different techniques such as the Barnes Hut simulation, degree-dependent repulsive force, and local and global adaptive temperatures. Source

Il a l’avantage de présenter un certain nombre d’options d’affinage algorithmique et visuel.

Ici avec la taille des noeuds proportionnelle au degré entrant

Oh un coeur !

Et là, proportionnelle au nombre de followers

Les forces gravitationnelles éjectent les personnes très peu suivies hors du réseau
Le point “central” en bas en orange, c’est moi

Visualisations finales

Le MediaLab de Sciences Po, membre du consortium Gephi, a concocté une vidéo de présentation de son algorithme ForceAtlas2 (cocorico) en le comparant aux deux autres que je vous ai présentés. Open Ord est un algorithme pour les réseau non-directifs, comme Facebook.

Vous trouverez également ici un très bon tutoriel pour utiliser ces algorithmes

Revenons à notre réseau et comparons les différentes spacialisations. En premier, on retrouve celles qui mettent en valeur le degré entant (donc, relatif à ce réseau) et en second le nombre de followers (nombres absolus).

Note : Pour la suite, j’ai relancé les algorithmes et modifié quelques options pour avoir de meilleures visualisations.

Fruchterman Reingold

La visualisation basée sur cet algorithme place les comptes qui ont le plus de followees dans ce réseau au centre. Dans la première image, les comptes au plus grand degré entrant (nombre de followers dans le réseau) sont mis en valeur par une taille de noeud et de police plus grande. Dans la seconde, ce sont les comptes au plus grand nombre de followers dans l’absolu qui le sont.

Yifan Hu

La visualisation basée sur cet algorithme donne des rendus sensiblement identiques aux précédents, en comprimant un peu plus le centre.

ForceAtlas 2

La notion de centre est moins présente et on a une meilleure vue des communautés et des frontières entre celles-ci.

ForceAtlas2 avec “Mode LinLog”

Ici, on a une vue opposée : les comptes au plus grand nombre de followees se retrouvent à la périphérie. Plus le nombre de liens sortants est élevé (dans le réseau, pour rappel), plus ils sont loin du centre.

Petite histoire

Vous l’aurez remarqué, les communautés de mon réseau sont claires ! Reprenons la visualisation créée avec l’algorithme ForceAtlas2.

Le fichier en haute définition (65 mo) ici
  • À gauche, on retrouve les comptes dont je suis le seul follower de mon réseau.
  • On identifie trois communautés évidentes : celle du journalisme en haut en violet, celle de la recherche et des institutions en vert (française en vert clair et américaine en vert foncé) et celle de Lyon (avec mes camarades de promo notamment) et de l’architecture de l’information et du design en bleu
  • On retrouve les membres de l’association Jets d’encre, dont j’ai été membre il y a quelques années, en orange, proche du réseau violet des médias et journalistes.
  • Regardons deux sous-communautés : celle des personnes de la communauté du journalisme mais qui flirtent avec la recherche et regardent ce qui se fait aux USA…
  • … et celle des chercheurs en design
  • On retrouve des personnes ou organisations très connectées (avec une forte centralité) qui jouent un rôle central, comme Axelle Lemaire, Usul, La quadrature du Net ou encore Pixels.
  • Certaines personnes ou organisations ont une centralité plus restreinte et jouent un rôle de passerelle entre deux communautés, comme Xavier de la Porte ou Martin Granjean.
  • Bref, si ce n’est pas nouveau, je me rends clairement compte que mon réseau Twitter reflète bien mon parcours et mes centres d’intérêt : (i) le journalisme, (ii) le journalisme multimédia, (iii) le journalisme par projets, (iv), l’UX design pour le journalisme, (v) le design tout court, (vi) les humanités numériques, (vii) le design pour la recherche et la recherche pour le design, (viii, actuellement) la recherche en sciences sociales computationnelles.

En bonus

J’ai utilisé le plugin Loxa Web Site Export pour créer un petit site où vous pouvez voir, dans le cadre de mon réseau, celui de chaque personne. Vous pourrez découvrir qui elle suit et par qui elle est suivie, sa place dans sa “communauté détectée” ainsi que les relations de followee/follower des personnes identifiées. (Grand écran conseillé. Peut ne pas fonctionner sur tous les navigateurs.)

Vous pouvez également télécharger le fichier de la visualisation en haute résolution ici (65 Mo).

Partie 4

Si vous avez ❤ cet article, recommandez et partagez-le :) Merci !