Voici mon réseau Facebook

Partie 4— Visualisation de mes communautés d’amis sur Facebook grâce à Lost Circles et Gephi

Les trois premières parties de cette série consacrée aux réseaux est accessible en suivant ces liens !

Note : Je vous conseille de bien lire les articles précédents afin d’avoir les clés pour comprendre la suite.

Récolter les données

Facebook est un réseau social non-dirigé, à l’inverse de Twitter. Sur Facebook, quand on est ami.e avec une personne, elle l’est également avec nous.

Votre liste d’ami.e.s peut être retrouvée sur votre page, onglet “amis”. Pour moi, elle se trouve par ici.

Pour récupérer les données de votre réseau d’ami.e.s Facebook, c’est très simple. L’extension Lost Circles (sur Chrome uniquement, même pas Vivaldi par exemple) s’en charge très bien pour vous !

IMAGE LOST CIRCLES

  • Installez l’extension
  • Vérifiez que vous êtes connecté à Facebook
  • Cliquez sur l’icône qui vient d’apparaître en haut à droite
  • Cliquez sur Start Loading. Vous verrez l’extension ouvrir un nouvel onglet avec votre liste d’ami.e.s et une nouvelle fenêtre parcourant les ami.e.s de vos ami.e.s.
  • Une fois le chargement à 100 % (ce qui peut prendre du temps), cliquez sur Download puis sur Graphgml (no pics). On a un fichier tout chaud pour Gephi.
  • Cliquez maintenant sur Visualize !

Visualisation avec Lost Circles

Je passe tout de suite à la visualisation avec Gephi qui donnera un peu de plus de sens au réseau. Toutefois, vous noterez déjà, dumoins dans mon cas, cinq communautés bien séparées.

Remarque : je ne figure pas sur le graph, contrairement à celui de mon réseau Twitter. En effet, s’il est possible sur Twitter de ne suivre personne tout en étant suivi par un très grand nombre de comptes, c’est impossible sur Facebook. Dans la visualisation de votre réseau Facebook, vous seriez de fait relié à tout le monde, quellles que soient les données utilisées.

Visualisation avec Gephi

Données préalables (souvent calculées par Gephi)

  • Il y a 171 noeuds dans mon réseau (je n’explique pas la différence négative de 6 noeuds)
  • Ces noeuds ou ami.e.s sont relié.e.s par 447 liens
  • Le degré moyen dans mon réseau est de 5,2, ce qui veut dire que chacun.e de mes ami.e.s a en moyenne 5,2 ami.e.s dans mon réseau
  • La densité du réseau est de 3,1 % (elle serait de 100 % si toutes les personnes de mon réseau étaient amies)
  • Le chemin le plus long entre deux ami.e.s est de 11 liens (le diamètre du réseau)*
  • Et le chemin moyen de 4,43 liens (le diamètre moyen)*
  • La modularité de mon réseau est de 0,70
  • L’algorithme de détection de communautés en trouve 37 (!)
  • 32 ami.e.s sont peu ou pas connectées au reste du réseau
  • Le coefficient de clustering global du réseau est de 0,55

*Ces données sont biaisées puisque je ne suis pas dans le réseau

Spacialisations algorithmiques

OpenOrd

It is one of the few force-directed layout algorithms that can scale to over 1 million nodes, making it ideal for large graphs. However, small graphs (hundreds or less) do not always end up looking so good. This algorithm expects undirected weighted graphs and aims to better distinguish clusters. Source

Comme expliqué, l’algorithme n’est pas parfait avec un faible nombre de noeuds, comme mon réseau Facebook. Toutefois, le détour est valable :

La taille des noeuds représente ici le ratio de centralité intermédiaire

Lançons les algorithmes vus précédemment.

Fruchterman Reingold

Avec paramètre de gravité
Sans paramètre de gravité

Yifan Hu

ForceAtlas 2

Avec paramètre de gravité
Sans paramètre de gravité

Les algorithmes OpenOrd et Yihan Hu s’appliquent à positionner la communauté centrale (la verte) au centre et compriment le tout. Ceux de Fruchterman Reingold et ForceAtlas 2 s’efforcent de garder la visualisation dans un espace limité tout en éclatant les communautés.

Explications

Reprenons cette dernière visualisation en grossissant les noeuds à forte centralité intermédiaire.

Nous observons quatre grosses communautés

La bleue représente celle de mon master à Lyon, la verte celle de ma Licence professionnelle à Paris 8, la rose celle de mon BTS audiovisuel à Marne-la-Vallée et la orange à l’association Jets d’encre.

Note : Cette communauté n’est pas parfaitement représentée (certainement à cause d’erreurs dans les données) car la majorité de mes ami.e.s y sont également ami.e.s entre elleux.

Les communautés bleue, orange et rose sont reliées entre elles seulement via la communauté verte. On assiste véritablement à quatre “petits mondes”.

Lorsqu’une ou un ami.e d’une communauté est connectée à une deuxième communauté via une autre personne, nous noterez que son ratio de centralité intermédiaire explose. En d’autres termes, si mon ami.e la/le plus “isolé.e” de la communauté orange voulait envoyer un message personne la plus isolée de cette dernière communauté, sachant que ce message ne peut passer que d’ami.e en ami.e, celui-ci transiterait (ici, forcément) par la personne connectée à la communauté verte et par la personne la plus connectée de la communauté bleue.

Quatre petites communautés

On discerne par ailleurs quatre petites communautés, la violette (la famille), la verte-jaune (la colo), la beige (le groupe de musique) et la jaune (la Norvège). Les deux dernières ne sont pas du tout reliées au reste du réseau.

Vous pouvez télécharger le fichier de la visualisation en haute résolution ici (4 Mo).

La suite ?

J’espère que le prochain article sera prêt avant le 23 avril puisque je visualiserai les réseaux Twitter des candidats à la présidentielle. Je m’efforcerai également à donner des clés de lecture plus “scientifiques”, sans toutefois m’improviser chercheur ou journaliste.

Si vous avez ❤ cet article, recommandez et partagez-le :) Merci !