Affaire Benalla : une controverse sous influence ?

Damien Liccia
damien-liccia
Published in
41 min readAug 7, 2018

L’affaire Benalla, par-delà ses conséquences d’ordre politique et médiatique, s’est caractérisée par une nette réactualisation des lignes de fracture de la vie politique française. Les forces de l’opposition à La République En Marche (LREM) ont appréhendé cette affaire comme une aubaine à la croisée de la lutte politique et de la contre-influence. Révélée par Le Monde, et alimentée pendant plusieurs jours par une couverture médiatique particulièrement importante, notamment suite à la série d’auditions devant les commissions d’enquêtes parlementaires, l’affaire a constitué un véritable point de fixation pour l’opinion publique. En témoignent notamment les records d’audiences réalisés par LCP ce qui est tout même loin d’être anodin[i].

En 2018 cela ne revêt qu’une forme d’originalité très relative que de signaler que ce nouvel acte de conflictualité informationnelle et digitale s’est déroulé, en grande partie, dans cette lice de nos sociétés numériques qu’est Twitter.

Twitter, contrairement à Facebook, est l’espace priviligié de la bataille de l’attention et du conflit pour imposer un framing à une affaire et un cadrage d’ordre tout à la fois politique et idéologique. S’il fallait de manière succincte, et nécessairement caricaturale, détailler les caractéristiques qui consacrent Twitter dans ce rôle, l’approche par la négative nous semble la plus à même de les mettre au jour :

1 Twitter est un espace public, où seuls les comptes privés échappe partiellement à cet état de fait[ii].

2 Twitter est une plateforme de l’extimité synthétique, là où Facebook est une plateforme de l’intimité narrative. Sur Twitter, les militants s’affichent comme tels, brandent leurs comptes avec des hashtags à l’image du #FBPE pour les pro-Union européenne ou utilisent des symboles marquant une appartenance politique comme le phi (φ) porté par les militants de La France Insoumise. En d’autres termes, pour un analyste il est aisé d’utiliser Twitter pour cartographier des réseaux et appréhender les stratégies discursives mises en place par un compte et/ou une organisation.

3 Si Twitter est un lieu éminemment conflictuel c’est également grâce à la possibilité offerte par la plateforme de compter les points. Cela peut se faire de manière purement qualitative en scrollant la discussion relative à un topic et en repérant les top tweets ou bien de manière plus détaillée en récupérant de la data via l’API. Là où celle de Facebook s’est progressivement fermée, Twitter, bien qu’enclin, suite aux différentes polémiques sur les fake news, à restreindre son interface de programmation, met à disposition des analystes des ressources particulièrement denses. En somme, avec Twitter on peut compter les balles de 7.62 tirées par les différentes forces en présence, là où sur Facebook il est difficile de déterminer si la cible est atteinte. Et si oui, quel en a été l’impact direct.

4. Dans la lignée de ce constat, nous pourrions ajouter, là encore de manière quelque peu caricaturale, que Facebook est le lieu de l’influence purement communautaire (où seul l’achat d’espace permet de 1) augmenter son reach 2) sortir de sa base de likers organiques 3) toucher des communautés exogènes; là où sur Twitter, un tweet peut donner lieu à une fusion communautaire, à des configurations étonnantes où un influenceur de droite peut être repris par des militants d’extrême gauche parce que son contenu, publié à un moment spécifique, entre en résonance avec une opération impulsée par ces derniers. Twitter est le plateforme du kairos et de la fulgurance, là où Facebook apparaît davantage comme celle du temps long et des communautés captives progressivement acculturer à une ligne éditoriale déployée par une page donnée.

Dès lors, et alors que nous sommes, semble-t-il, dans la phase de ressac de l’affaire Benalla, et alors que tendent à émerger des discours de post-rationalisation de la crise, il nous paraît intéressant de mener une étude présentant la configuration et la structuration de la discussion relative à cette affaire. L’idée n’est bien évidemment pas d’aborder celle-ci en elle-même, d’autres bien plus à la page que nous s’y activent de manière quotidienne depuis le 18 juillet, ni encore moins d’analyser son phénomène de médiatisation mais plutôt de l’appréhender à l’aune de la médiation introduite par les spécificités de Twitter.

Cette étude souhaite également s’intéresser à un point spécifique, qui anime nos travaux depuis maintenant plusieurs années, et qui visent à questionner, non pas tant la prétendue ingérence russe dans une conversation spécifique, que le discours associé à cette prétendue ingérence.

Comme nous le précisons à chaque fois, nous employons le terme de « prétendu » de la manière la plus neutre possible. Cela ne revient pas à émettre un jugement de valeur revêtant une tonalité ironique quant aux discours voyant l’action du Kremlin derrière chaque fait saillant de nos démocraties occidentales, mais au contraire, cela permet de partir à chaque article d’une tabula rasa.

Nous ne partons pas du principe que les Russes et/ou les « russophiles », catégorie apparue au début du mois d’août 2018 et qui, après avoir suscité un certain buzz médiatique, a suscité un non moins important émoi au sein de la communauté des chercheurs, experts et autres analystes s’intéressant à la question de l’influence digitale, ont exercé une influence sur une conversation donnée. Au contraire, nous procédons de manière méthodique à une autopsie conversationnelle, et nous essayons de respecter au maximum une logique analytique transparente et processée. Ce terme médical, bien que quelque peu morbide, nous semble malgré tout particulièrement éclairant pour qualifier notre démarche de dissection de la conversation.

Nous partons sans a priori et essayons, autant que faire se peut, de mettre au jour un maximum d’insights de notre corpus d’étude.

La logique qui anime ce travail est anti-binaire, et aux assertions franches et percutantes, nous préférons toujours les nuances de gris, les zones d’ombres et l’équivocité persistante. Cela rend l’étude moins communicable, moins à même de faire le buzz, mais cela a le mérite, selon nous, de proposer un matériau non pas clôt sur lui-même, mais au contraire propice à susciter débat, réflexion et nouvelles études.

Méthodologie

Notre corpus est constitué de 566 302 tweets uniques (les retweets ne sont pas pris en compte par cette analyse), émis par 111 050 utilisateurs uniques entre le 17 et le 27 juillet. A titre indicatif, la volumétrie tweets uniques + retweets est de 3 361 039 mentions.

Les deux points d’entrée sémantiques de notre corpus sont les items « benalla » et « macron ». Contrairement à d’autres études menées sur ce type de sujets, nous avons utilisé un script python pour récupérer la conversation sur ces mots clés de manière a posteriori. Ce script particulièrement efficace permet de récupérer les différentes écritures d’un item de recherche, par exemple bien que l’un de nos mots clés soit « benalla », nous avons bel et bien récupérer des hashtags du type « #AffaireBenalla », « #BenallaMacron »… Cette approche, via python, a déjà été utilisée dans le cadre d’une étude précédente réalisée sur la Catalogne, et s’est avérée particulièrement satisfaisante concernant le volume de données pouvant être récupérées de la plateforme Twitter. En toute transparence, et nous estimons qu’en l’état actuel des choses les études relatives à l’analyse de controverses digitales pêchent bien souvent par un manque de lisibilité quant aux limites et/ou biais méthodologiques induits par leurs approches respectives, nous tenons à signaler que l’utilisation de python est potentiellement (et même sûrement) moins exhaustive que les datas pouvant être fournies par des solutions de monitoring classiques, comme Visibrain ou Talkwalker.

Pour autant, en comparant la volumétrie de notre corpus avec les datas fournies par des focus en quick trends proposés par les solutions de monitoring ils s’avèrent que notre corpus est à peine sensiblement inférieur à ces dernières, qui relèvent de leurs côtés 624 049 tweets uniques.

Dernière précision méthodologique, mais qui n’est pas dénuée d’importance. Notre étude se base, comme expliquait antérieurement, uniquement sur les tweets organiques émis. Les retweets ne sont donc pas dans notre scope. Pourquoi cette approche ? Est-elle délibérée ou contrainte ?

Le script python que nous avons utilisé ne permet de remonter que les tweets organiques, et de facto ne parvient pas à récupérer les retweets/retweeters agrégés autour d’un tweet. S’ils remontent les statistiques associées à une publication (nombre de retweets, nombre de likes…) il ne permet pas de voir quels sont, par exemple, les utilisateurs ayant partagé le tweet de Madame Michu. Pour autant, dans notre démarche cela ne nous dérange pas car, comme nous l’avons déjà réalisé dans le cadre de notre étude sur l’influence dans le cadre du référendum catalan de 2017, il nous paraît intéressant de travailler uniquement sur la base de tweets organiques. Si nous avions souhaité étudier l’affaire Benalla à l’aune du prisme des retweets, nous aurions lancé un crawler dédié.

Ce n’est donc pas un choix sous la contrainte, mais au contraire, une décision répondant à un axe spécifique de nos travaux de recherche.

En termes de traitement de données, nous avons utilisé le logiciel de cartographie Gephi pour l’analyse de réseau et le langage R pour exploiter notre corpus. Le langage R présente l’avantage de pouvoir constituer de manière réellement sur-mesure des scripts pour analyser un angle spécifique d’un sujet. Cette liberté analytique permise par R est essentielle pour appréhender de manière précise la structuration d’une conversation, ainsi que de pouvoir allier constamment une approche quantitative avec une logique davantage tournée vers le qualitatif.

Les acteurs au centre de la conversation

De manière liminaire, est avant de rentrer dans le vif du sujet, il nous paraît intéressant d’avoir une vision synthétique des acteurs référents de la controverse. La cartographie ci-dessous, dont la matrice a été réalisée via un script développé en R, met au jour les acteurs centraux de l’affaire.

Par centralité, nous entendons les comptes Twitter cités de manière récurrente dans la conversation.

Pour constituer notre matrice, nous partons de la logique : un utilisateur X1 émet un tweet dans lequel il mentionne les comptes Twitter de X2, X3 et X4. Nous créons à partir de cela un tableau en deux colonnes se répartissant comme suit, une colonne Source et une colonne Target. A partir de cela, nous introduisons un autre paramètre, en vue de l’analyse via Gephi, concernant le poids (Weight) des liens.

Cette approche n’est pas dénuée de biais méthodologiques, et tranche avec les matrices classiques basées sur les interactions liées aux retweets.

Pour avoir depuis plusieurs années eu la possibilité de comparer les différentes manières de créer un graphe de réseau, l’approche par la centralité a l’avantage de présenter de manière précise et synthétique les utilisateurs qui font autorité dans la discussion donnée.

Il ressort de cette cartographie que 3 écosystèmes spécifiques ont été appréhendés comme centraux et référents durant la controverse :

· En vert, l’écosystème médiatique

· En bleu, la majorité présidentielle et ses figures de proue

· En rouge l’opposition

Sur le plan purement médiatique, on constate que ce sont Le Monde et BFM TV qui apparaissent comme au cœur de la structuration de la conversation. De manière logique, seule Ariane Chemin, parmi les journalistes cités, surnage en termes de nombre de mentions. C’est elle qui est à l’origine de l’affaire Benalla, et de facto cette capacité à mettre cette affaire sur l’agenda rejaillit sur les réseaux sociaux, et lui donne une certaine autorité.

Au niveau de l’écosystème de l’opposition, deux forces politiques apparaissent distinctement :

· Les Républicains (LR) sont représentés par Eric Ciotti (intervenant particulièrement incisif dans la commission d’enquête de l’AN), Guillaume Larrivé (co-rapporteur de la commission aux côtés de la député LREM Yael Braun-Pivet) et Philippe Bas (président de la commission des Lois du Sénat)[iii]. Laurent Wauquiez n’apparaît comme un acteur central du côté des LR, et cela tranche avec la logique que nous pouvons observer concernant l’écosystème des Insoumis.

· La France Insoumise (LFI) est représentée par Jean-Luc Mélenchon, Alexis Corbière et Eric Coquerel. A la marge on note également la visibilité d’Ugo Bernalicis ou encore de Danièle Obono.

Du côté du Rassemblement National (RN, ex-FN), la faiblesse en termes de représentativité parlementaire du parti se retrouve dans la cartographie. La dimension hyper-parlementarisée de la séquence n’étant guère propice à une forte visibilité pour un parti faiblement représenté à l’AN. A noter toutefois, que le député Sébastien Chenu tire légèrement son épingle du jeu.

Un constat similaire peut être fait pour Nicolas Dupont Aignan et son parti Debout La France. Le PS n’échappe à ce constat, et seul Boris Vallaud surnage quelque peu.

Que conclure de cette analyse liminaire ?

Une cartographie est intéressante par ce qu’elle révèle, mais aussi et surtout, par ce qu’elle ne montre pas. Il ressort de ce graphe que nous avons affaire de manière macro à une conversation structurée selon des logiques politiques classiques avec 3 forces spécifiques en présence (médias, opposition et majorité).

La cartographie ne fait pas apparaître un groupe exogène à cette configuration tripartite classique, et qui se serait constitué de manière ad hoc pour venir instrumentaliser l’affaire Benalla.

En d’autres termes, cette cartographie, avec ces biais méthodologiques que nous avons souligné dans notre propos introductif, met au jour l’absence de comptes « suspects » ayant pu avoir une influence dans le cadrage et la structuration de la conversation. L’absence de comptes « suspects » ayant pu faire autorité sur le sujet, ne signifie pas pour autant l’absence d’opérations d’influence.

Mais a minima, ce constat a le mérite d’introduire quelques éléments de nuance par rapport à certains discours qui tendent à attribuer, de manière plus ou moins précise, une force de frappe manifeste à de comptes menant des opérations au service de puissances étrangères. Les comptes les plus mentionnés ne font que décalquer sur Twitter le schéma de l’ « ancien monde ».

Les personnalités politiques et les médias classiques sont encore les forces qui disposent d’une autorité reconnue et avérée sur les communautés hétéroclites qui composent la scène française sur Twitter.

Par exemple, nous ne retrouvons pas dans ce graphique la présence d’un compte, que nous qualifierons d’exogène, dans l’acception plurielle du terme, à même de venir contrebalancer le nombre de mentions reçues par un élu, un média et/ou une journaliste. Dans le cas contraire, si par exemple un compte avec un username type @plutarque76893467 était mentionné au même niveau qu’un acteur politique comme Jean-Luc Mélenchon, le constat serait tout autre.

Dans cette configuration, cela reviendrait à constater qu’un compte dénué d’attributs identitaires, hormis les quelques traces numériques qu’il peut laisser, est à même d’être aussi référent sur une controverse qu’une figure majeure de la vie politique française.

Pour étayer notre propos, il serait inquiétant de constater que sur une cartographie des acteurs référents nous retrouvions des utilisateurs comme ceux qui sont représentés dans la cartographie ci-dessus.

Cette dernière représente les liens entre utilisateurs les plus actifs en termes d’émission. Il est difficile de les ranger dans une seule catégorie, et cela reviendrait à réduire une part significative de la complexité du réel et du sujet, mais ce sont bien souvent des comptes de militants, des comptes trolls, des comptes gravitant dans l’entourage de partis politique, et qui capitalisent sur une affaire sensible pour servir in fine des intérêts d’ordre purement politiques. Nous ne détaillerons pas davantage cette cartographie, afin de ne pas être redondant avec la suite de l’étude, qui pour sa part analysera en profondeur l’influence de ce type de comptes.

La mise en perspective de ces deux cartographies nous apparaît quoi qu’elle en soit intéressante, au sens où, de notre point de vue, les analyses réalisées ces dernières années sur le sujet de l’influence dans le cadre d’élections notamment, tendent trop souvent à mélanger autorité et activité d’un compte.

L’autorité dépend de paramètres multiples, dont une part substantielle est totalement extérieure à Twitter. Quant à l’activité, et bien souvent l’hyperactivité, des comptes souvent pointés du doigt comme s’adonnant à des œuvres de manipulation informationnelle, elle est bien souvent corrélée à une absence totale d’autorité et encore moins d’influence.

Un compte peut très bien inonder Twitter avec des dizaines et dizaines de tweets, mais pour autant plusieurs constats peuvent venir nuancer l’idée de l’influence exercée par ces prétendus bots, dont la simple évocation induit dorénavant l’adjectif « russe » :

1 La force de frappe réelle d’un bot réside essentiellement dans sa capacité à faire du publishing (relais d’articles de sources définies par l’utilisateur) et des retweets. Cela permet potentiellement d’augmenter artificiellement l’engagement sur des publications prétendument en phase avec une stratégie politique/géopolitique globale. Ce point n’est pas anecdotique, et nous ne le sous-estimons pas, mais nous sommes bien loin de la bataille sur les narratifs et de la contre-influence articulée autour d’axes rhétoriques élaborés pour faire de la deception. Que ce soit dans les controverses françaises, ou sur les travaux que nous avons pu mener sur le cas du référendum catalan, nous avons rarement vu des comptes « suspects », avec une hyperactivité manifeste, et dont les tweets témoignaient d’un discours élaboré. Nous ne disons pas qu’ils n’existent pas bien entendu, mais les comptes combinant hyperactivité et discours cohérents basés sur des tweets organiques sont un peu comme Mew dans Pokémon Go, cdx Pokémon rares. Nous précisons d’ailleurs que nous parlons ici uniquement de Twitter, et aucunement de Facebook. Ce constat explique d’ailleurs pour quelles raisons nous préférons nous intéresser uniquement aux tweets organiques.

2 Avec les comptes purement bots nous sommes davantage dans le spamming bas de gamme que dans l’opération d’influence digne de ce nom. En témoigne l’engagement bien souvent marginal réalisé sur les tweets émis par les comptes en question. Nous reviendrons sur ce point dans la suite de notre propos.

3 Même Madame Michu ou Monsieur Duchmol peuvent à ce jeu-là faire de l’influence digitale et acheter des fake retweets par exemple. Cela est moyennement qualitatif, voire même pas du tout, mais au moins cela évite de monter des architectures d’astroturfing complexes. D’aucuns nous objecterons, « oui mais l’intérêt des bots c’est qu’ils disposent d’une communauté captive sur laquelle ils peuvent exercer leur influence, là où l’achat de fake retweets ne permet que d’obtenir que du fake engagement ». Nous reviendrons tout particulièrement sur cette objection spécifique dans la suite de notre propos, pour montrer les limites de ce type d’assertions.

4 L’analogie est rarement faite, mais on pourrait très bien considérer que l’influence des bots « suspects » est peu ou prou équivalente aux opérations de psyops réalisées notamment en Irak et en Afghanistan par les soldats américains, et qui consistaient à larguer des kilos de tracts de leurs Black Hawks. En termes de ciblage, de targeting et d’ingénierie sociale, cela n’est pas l’approche la plus impactante en matière de stratégie d’influence.

5Dernier point, Twitter a une approche très proactive en matière de lutte contre le spamming[iv]. Les comptes bots, encore que ce terme ne soit réellement pas très opérant, qui se branchent à l’API Twitter pour faire du publishing ou du mass following s’exposent par exemple à toute une série de limitations de la part de Twitter, pouvant aller de la suspension momentanée à la suspension définitive. Lorsqu’un compte joue trop avec les limites de Twitter, il s’expose à des restrictions multiples au risque de voir le reach de ses publications diminuer. En d’autres termes, Twitter n’indexe plus dans le flux les tweets émis par ces utilisateurs. Cette sanction n’est pas forcément assortie d’une notification de la part de Twitter.

Qu’en est-il dès lors de l’activité et de la prétendue influence exercées par les comptes hyperactifs/bots/trolls dans le cadre de l’affaire Benalla ?

Bien que nous ayons commencé notre étude en amont de la publication du communiqué de presse du think tank EU Disinfo Lab qui pointe du doigt l’hyperactivité de certains comptes dans la discussion, et surtout met en avant l’idée d’une influence importante de comptes pro-Russes (dans une communication ultérieure, le think tank passera du critère de la « nationalité » à un autre paramètre tout aussi questionnable, à savoir la prétendue « russophilie » des comptes) dans la conversation française, nous ne pouvions rester insensibles à cette étude (non publiée à l’heure où nous publions cette analyse).

L’emballement suscité par les bribes de statistiques communiquées par EU Disinfo Lab à des médias entre en résonance avec nos problématiques de recherche, et notamment concernant notre intérêt relatif à l’utilisation des discours sur les fake news et ou les bots russes à des fins politiques. En témoigne, notamment la prise en compte de cette étude par des acteurs de la majorité, que ce soit Mounir Mahjoubi ou Benjamin Griveaux, ou plus périphériques à LREM comme l’ancien ministre Frédéric Lefebvre. Sur ce point spécifique, et nous aurons l’occasions d’y revenir, il nous paraît pour le moins inquiétant qu’une non étude (car non publiée au moment où ces personnalités politiques se sont emparées des conclusions communiquées aux médias) puisse venir à ce point influencer le monde médiatique et politique ; et qu’à partir de ces conclusions certains puissent en venir à parler de « manipulation d’ampleur ».

Nous concernant, afin d’essayer d’analyser l’effectivité d’une telle « manipulation » nous avons procédé, dans un premier temps, en 6 étapes :

1. Nous avons calculé le nombre « n » d’utilisateurs ayant émis le plus de tweets organiques

2. Nous avons récupéré des données sur le nombre de followers d’un compte que nous appelons le « followers_count »

3. Nous avons réalisé, à titre purement indicatif, un ratio d’influence d’un compte avec la formule suivante : influence = n * followers count. Sur ce point spécifique nous avons bien conscience que cette formule est loin (très loin) d’être parfaite, mais elle a le mérite de restituer a posteriori des éléments pouvant nous permettre de déterminer la portée potentielle d’un compte. Nous précisons à ce propos que les calculs de portée sont toujours particulièrement problématiques, et seuls ceux fournis par Twitter au propriétaire d’un compte donné sont réellement pertinents.

4. Les gros comptes de médias traditionnels, de personnalités existantes, de partis politiques et d’élus existants ont été supprimés

5. Ne sont plotés que les comptes ayant émis plus de 40 tweets organiques. Ce chiffre est en soi purement arbitraire, mais il peut être appréhendé comme un indicateur d’hyperactivité

6. Ne sont labellisés que les comptes dont n > 100 et ayant plus de 10K followers et/ou des comptes ayant émis plus de 500 tweets

Une fois ces calculs réalisés, on obtient avec R et la librairie ggplot le graphique suivant qui :

· Positionne en abscisse la variable « followers_count »

· Positionne en ordonnée la variable « n »

· La coloration en gradient est définie à partir du ratio influence. Plus un compte est rouge plus la portée potentielle de ses publications est importante. Ainsi, bien que @jeanloque est émis le plus de tweets (1 845) le fait qu’il ne dispose que de 525 followers tend à nuancer l’influence réelle de cet utilisateur. A contrario, @KimJongUnique bien qu’il ait publié un nombre bien inférieur de tweets (119) jouit d’une force de frappe bien plus conséquente avec ses 38 391 followers

Quels enseignements peut-on mettre au jour à partir ce graphique ?

1 2 232 utilisateurs de notre corpus ont publié plus de 40 tweets sur l’affaire. Nous les appellerons désormais les « hyperactifs » dans un souci de clarté, bien que évidemment le seuil de 40 tweets n’équivaut pas stricto sensu à de l’hyperactivité

2 Les comptes « suspects » ayant été très actifs et ayant une influence non négligeable sont notamment : @KimJongUnique, @Padre_Pio, @Dreuz_1fo, @gilloq, @hdebonnevolonte, @citoyennefrance ou encore @belindageoly

3 Le rectangle en bas à gauche, où se concentre une quantité importante de point bleus, est intéressant car il est composé de 2 131 comptes répondant aux conditions suivantes : 500 >n > 40 et followers_count < 10 000

4 A contrario, cela signifie que nous avons 99 comptes répondant aux conditions suivantes : n > 500 et/ou followers_count > 10 000

La comparaison @jeanloque versus @KimJongUnique nous apparaît comme particulièrement intéressante car elle permet d’illustrer de manière très précise la nécessaire différence entre influence réelle et influence supposée, ou entre autorité et activité.

Le fait d’avoir constamment en tête la nécessaire dichotomie entre ces deux logiques, permet d’éviter les conclusions du type :

Ce nécessaire distinguo est finalement peu ou prou similaire à celui qui doit seoir dans le monde de la recherche entre l’étude que nous pourrions qualifier comme encline à céder aux sirènes du clickbait, et au calibrage de l’information pour favoriser son influence sur Twitter, et l’étude qui s’intéresse aux nuances de gris dans une structuration conversationnelle.

Nécessairement cette dernière ne peut que pâtir de la dimension ambigüe et équivoque de ses conclusions, qui loin d’être des assertions, visent au contraire à ouvrir des lignes de fuites.

Ce faisant, en continuant notre investigation des comptes hyperactifs, et fidèle à notre ligne méthodologique, il nous semblait intéressant de questionner davantage la question de l’influence suscitée par ces comptes hyperactifs.

Au sein du corpus que nous avons isolé des 2 232 utilisateurs hyperactifs, les comptes qui répondent aux conditions :

· Les utilisateurs ayant émis moins de 500 tweets et disposant d’un nombre de followers inférieur à 10K, comptent pour 95,4% de notre listing. Dans le graphique ci-dessous, nous parlons de « catégorie n°1 » et ils sont représentés par le couleur verte.

· Nombre de tweets publiés sur le sujet > 500 et/ou followers_count > 10K comptent pour 4,4% de notre listing. Ces derniers constituent d’une certaine manière les premiers de cordée de l’hyperactivisme. Dans le graphique ci-dessus, nous parlons de « catégorie n°2 » et ils sont représentés par le couleur orange.

· Logiquement, et du fait de son nombre, la catégorie n°2 a émis bien moins de tweets que la catégorie n°1. Respectivement 14 906 et 169 370.

· Si le constat est nettement déséquilibré en matière d’émission, il est davantage plus équilibré lorsque nous nous intéressons à l’engagement suscité par ces deux franges spécifiques des hyperactifs. La catégorie n°1 compte pour 60% (soit 1 107 751 engagements) des engagements suscités par les hyperactifs, tandis que la catégorie n°2 en a suscité presque 40% (738 410).

· Ces constats tendent à indiquer, que bien que numériquement beaucoup plus faible, la catégorie n°2 dispose d’une force de frappe, certes inférieure, mais qui n’en est pas moins à même de contrebalancer le nombre d’engagements suscités par la catégorie n°1

L’analyse du graphique ci-dessus, nous permet d’élargir notre focale, et d’appréhender de manière comparée les hyperactifs que nous avons isolé avec l’ensemble de notre corpus.

Il en ressort que :

· 2%[v] des comptes ont émis 32% des tweets organiques sur l’affaire et ont contribué a suscité 1 847 988 engagements (soit 29% des engagements totaux).

· Mais, et comme allons le démontrer, il est pour le moins incongru de partir de ce constat factuel et statistique et d’aboutir à la thèse d’une manipulation exogène.

Là où dans le graphique en point précédent nous avions fondé notre indice d’influence sur un ratio accordant une part significative au reach, dans le graphique ci-dessous au contraire nous mettons l’engagement (engagement = retweets + likes) au centre de notre scope.

Au niveau méthodologique, pour réaliser ce graphique nous avons procédé de la sorte :

· L’abscisse correspond au nombre de tweets organiques émis par un compte

· L’ordonnée correspond à l’engagement total suscité par les tweets d’un utilisateur

· Ne sont présents sur ce graphique que les utilisateurs ayant réalisé plus de 10K engagements. Ce chiffre, qui est nécessairement arbitraire est basé sur un postulat, discutable mais qui n’en est pas moins opérant. Un compte réellement influent sur un temps fort type affaire Benalla et qui serait entièrement dévolu à des activités d’influence digitale est mesure de dépasser ce plafond. En effet, les comptes qui cadrent une discussion dans ces phases d’effervescence suscitent souvent des niveaux d’engagement du type 900 retweets et 300 likes par exemple. Si l’on ajoute à ce constat, le tropisme des comptes hyperactifs à émettre un nombre de tweets largement supérieur à 50 sur une période donnée, il semble raisonnable de fixer un seuil aux alentours des 10K engagements

· Dans un souci de visibilité, seuls les comptes ayant publiés plus de 20 tweets sont labellisés dans ce graphique.

Que mettre au jour à partir de ce graphique :

1 Premier constat, au niveau de l’écosystème médiatique élargi, BFM TV (@BFMTV), Le Gorafi (@le_gorafi), LCP (@LCP), Valeurs Actuelles (@Valeurs) et Brèves de Presse (@Brevesdepresse) ont chacun suscité plus de 45K engagements sur la période.

2 Au niveau des personnalités politiques, le président de la République sur la période a suscité 54K engagements — ce dernier n’a évidemment pas publié de tweets directement en lien avec l’affaire Benalla, mais du fait de nos items de requête, pour rappel « Benalla » et « Macron », nous avons de fait capté l’ensemble des tweets organiques émis par Emmanuel Macron. Nous avons choisi de les garder afin d’avoir un panorama réellement exhaustif des rapports de force en présence. En effet, entre le 18 et le 27 juillet, nous pouvons considérer que d’une certaine manière un retweet du PR équivaut à une forme de soutien. En sociologie nous pourrions quasiment parler de slacktivisme pour qualifier ce phénomène de militantisme/soutien consistant à témoigner un soutien à une personnalité et/ou à une cause par un retweet ou un like.

3 Au niveau des personnalités de la société civile, nous notons l’influence exercée par l’ancien policier Sébastien Jallamion, avec 68K engagements. Connu notamment pour avoir refusé de serrer la main à François Hollande et à Manuel Valls, on peut le ranger dans un écosystème gravitant autour du Rassemblement National. A noter que ce dernier dispose d’un compte Twitter verified.

4 La présence du compte @EnModeMacaron, mérite une attention plus poussée.

Nous avons ici clairement affaire à ce que nous pourrions qualifier de compte d’influence. Ce compte a été créé le 5 août 2017 et s’inscrit dans une logique relativement simple : critiquer de manière récurrente l’action du gouvernement. En termes d’émission de tweets organiques, il est intéressant de noter qu’une analyse portant sur ses 2 119 tweets révèlent que ces derniers sont exclusivement émis via Twitter for iPhone. Là où une utilisation classique de Twitter renvoie à mélanger de l’émission via web client et de l’émission via iPhone et/ou Android, cette spécificité de ce compte n’est donc pas anodine. D’un autre côté l’utilisation de Twitter qui est faite par ce compte ne requiert pas un haut niveau de technicité, et peut très bien être pilotée sur smartphone. Pour preuve, ce dernier n’a publié aucune vidéo dans ses tweets, lui préférant les photos (1 143 tweets en sont agrémentés, soit près de 54% de l’ensemble). Le nombre de tweets moyens publiés par jour n’est d’ailleurs que de 5,8 tweets, tous organiques (à l’exception de 3 tweets, mais qui s’avèrent être des auto-retweets). Dès lors, s’il nous est aisé de conclure que ce compte a été particulièrement influent sur la période, aucune donnée statistique renvoyée par l’API ne permet de :

o Considérer ce dernier comme un bot

o Considérer ce dernier comme piloté par une ferme

Nous avons davantage affaire à un compte de militants, potentiellement animé par d’ex-militants et/ou communicants d’une cellule digitale d’un ancien candidat à la présidentielle (soit LR, soit RN). Ce dernier peut être potentiellement tenu par 2/3 personnes afin d’assurer un bon fonctionnement et un bon roulement, ce qui permettrait d’expliquer l’absence de trous dans son activité.

Si nous avons pris, à dessein, le parti de nous intéresser de manière approfondie à ce compte c’est que par-delà son influence dans l’affaire en question, il est assez archétypique de ces comptes « suspects » qu’une analyse hâtive par corrélations éminemment questionnables pourrait faire basculer du côté des « russophiles » ; et qu’à partir de ces assertions certains pourraient en découler que @EnModeMacaron fait le jeu du Kremlin. Le seul jeu que fait ce compte est celui de ces commanditaires, et sa seule finalité n’est autre que de décrédibiliser le PR, Brigitte Macron et le gouvernement dans son ensemble.

A titre de comparaison, il s’inscrit dans une logique discursive similaire au « mouvement » Hollande Démission ayant rythmé toute une partie du quinquennat de François Hollande. Le même constat peut être dressé pour @Damocles_Fr.

5 L’équivalent La France Insoumise peut notamment être incarné par @NTM_FN, avec 36K engagements.

Ce compte est relativement actif, avec 1 001 tweets organiques publiés depuis le 19 juin. C’est un chiffre important, mais qui n’a pour autant rien d’ubuesque. Sans rentrer dans les détails, signalons tout de même que contrairement à @EnModeMacaron les sources d’émissions sont plus variées (Twitter for Android : 866 tweets, Twitter Web Client : 134 tweets et 1 tweet via Tweetdeck). Ce compte peut très bien être animé par un militant particulièrement actif, et pouvant être nourri en argu et/ou spiné par les militants de son écosystème. Concernant sa russophilie, une analyse qualitative de ses tweets fait voler en éclats toutes formes de logiques conduisant à une analyse du type russophile à bots russes. Sensible à la cause LGBTI ce compte s’insurge de manière récurrente contre les conditions des LGBTI en Russie. De manière plus politique, il n’hésite pas à utiliser le cas du financement russe de la campagne de Marine Le Pen. Pour autant sur le plan géopolitique, il apparaît plus mesuré quant à son appréhension de la Russie, et reprend en ce sens la grille de lecture proposée par LFI, tant à l’égard de la Russie que de ses interventions à l’étranger (notamment dans le cadre du conflit syrien).

6 Autre compte d’influence représenté dans notre mapping @KimJongUnique avec 39K engagements.

Celui-ci mérite qu’on si attarde tout particulièrement. Contrairement aux observations que nous avons pu effectuer sur les comptes d’influence précédents, @KimJongUnique est réellement multisport.

Comme l’indique le graphique ci-dessus, et le tableau ci-contre, l’utilisation faite de Twitter par ce compte témoigne très clairement d’une logique d’influence. Par exemple, en mai 2017 dans la même journée les tweets partaient tout aussi bien de l’interface web de Twitter, que des applications Android ou Iphone. Rien n’interdit d’avoir un iPhone et un Android, mais ce switching n’est pas anodin — et on le retrouve très rarement sur un compte dit « normal », surtout concentré sur une journée.

Afin d’étayer davantage ce point, prenons un exemple pour le moins révélateur. Le 9 novembre 2016, soit le lendemain de l’élection de Donald Trump, @KimJongUnique publie 7 tweets entre 5h48 et 7h27. Si l’on s’intéresse tout particulièrement aux deux premières lignes, on constate qu’en moins de 4 minutes, ce dernier passe d’un téléphone sous Android, à l’application Twitter for iPhone.

L’utilisation d’une solution comme Crowdfire témoigne également d’un souci affirmé de vouloir planifier en amont des publications. Pour autant, et c’est un point sur lequel il nous paraît essentiel d’insister tout particulièrement : @KimJongUnique n’est en aucun cas assimilable à un bot. Ce sont bien des humains (nous mettons à dessein le pluriel) derrière ce compte, et il n’est donc pas piloté par un algorithme miraculeux capable d’influencer à lui tout seul une controverse. Ce point est essentiel lorsque nous abordons l’épineuse question de l’influence russe.

L’analyse de son activité est également intéressante car elle fait ressortir deux éléments spécifiques : 1) Le compte répond à des logiques de phases pouvant être aisément isolées (primaires LR à l’autonome 2016, élection de Trump en novembre 2017 élection présidentielle de mai 2017, affaire Benalla…).

Sur le plan idéologique et géopolitique, le compte est en totale adéquation avec les grands axes idéologiques de la « Dissidence » française. Les tweets de @KimJongUnique s’inscrivent dans une rhétorique assez similaire à celle d’un utilisateur / Youtubeur comme le Lapin Taquin ou encore dans un discours proche de celui des « fans » d’Henri de Lesquen. Les connaisseurs du Youtube Game relèveront également quelques similitudes avec certaines saillies du Raptor Dissident. Pour autant, l’hypothèse selon laquelle il est animé par une petite team gravitant au sein de la « fachosphère » française n’a rien d’ubuesque, au vu des tournures de phrase et du côté troll qui caractérisent ce compte.

La fachosphère française, et nous renvoyons ici à l’excellent ouvrage de Dominique Albertini et de David Doucet, a été très tôt à l’avant-garde de l’utilisation d’internet comme continuation de sa lutte idéologique/politique.

· Dès lors, il peut sembler pour le moins bancal de renier la prégnance manifeste de cette filiation, pour voir dans chacun de ces comptes sous pseudos la main de Moscou.

Une fois analysés ces top comptes au comportement « suspect » force est de reconnaître qu’aucun élément tangible ne vient étayer l’idée d’une « manipulation attribuée aux comptes russophiles sur Twitter pour déstabiliser l’exécutif Français (sic) », pour reprendre la formule utilisée par l’ancien ministre et député Frédéric Lefebvre dans son courrier adressé le 2 août à Philippe Bas. Difficile également d’accréditer l’hypothèse d’une « manipulation d’ampleur », toujours selon Frédéric Lefebvre, portée par les forces hétéroclites de l’opposition. Cela ne résiste pas à nos premières constations et cela ne résiste pas à l’analyse du graphique mappant les comptes en fonction des deux paramètres retenus : nombre de tweets publiés et engagement.

En rétrécissant la focale sur la partie située en bas à gauche du graphique force est de reconnaître la dimension plurielle des acteurs également impliqués, avec une influence néanmoins moindre que ceux que nous venons d’analyser.

Se mélangent pêle-mêle pour la partie politique : Marine Le Pen (RN), Jean-Luc Mélenchon (LFI), Nicolas Dupont Aignan (DLF), Adrien Quatennens (LFI), Ian Brossat (PCF), Eric Coquerel (LFI), Valérie Boyer (LR), Jean Messiha (RN), Mathilde Panot (LFI), Danièle Obono (LFI), Olivier Faure (PS)…

Au niveau des journalistes, Edwy Plenel (Mediapart), Géraldine Woessner (Europe 1), Bruno Jeudy (Paris-Match), Anne Saurat (BFM TV), Luc Bronner (Le Monde)…

Au vu de ces éléments, et même si admettons (simple hypothèse de travail) que les Russes disposaient de relais d’influence opérant, efficace, crédible et faisant autorité, on pourrait se poser la question de l’intérêt de brûler des cartouches pour mener une opération tout bonnement…inutile.

Le sujet a été mis sur l’agenda par le monde médiatique lui-même, les journalistes, sur Twitter tout particulièrement, ont de manière significative adopter une approche oscillant entre critique à l’égard des errements gouvernementaux et ironie tout aussi corrosive. Dès lors, quel intérêt à jeter de l’essence sur un feu brûlant de lui-même, entretenu par des acteurs pluriels et faisant chacun, dans leurs champs respectifs, autorité.

Quid de l’automatisation des contenus ?

Le graphique ci-dessous représente un mapping des sources d’émission de tweets les plus utilisées. Afin d’en faciliter la lecture, nous avons placé en abscisse et en ordonnée la même variable, à savoir le chiffre « n » de l’utilisation des différents services d’émission. A noter que ne sont plotées que les sources ayant été utilisées plus d’une fois. Là encore toujours dans un souci de lisibilité, ne sont labélisées que les sources qui ont été utilisées plus de 50 fois.

En propos liminaires, nous souhaitons signaler que l’étude des sources d’émission en l’état actuel de la recherche sur les campagnes d’influence digitale, nous apparaît comme particulièrement stratégique pour appréhender le niveau d’authenticité et/ou d’automatisation d’un compte. D’une certaine manière l’analyse des sources d’émission permet d’essayer de toucher du doigt l’identité numérique d’un compte. Un compte qui se déclare comme celui d’un « retraité » par exemple et qui utilise deux OS simultanément pour tweeter, et/ou qui alterne entre l’interface Web et Tweetdeck, suscite nécessairement de l’attention.

Premier constat somme toute logique, « Twitter Web Client » (186 262 tweets), « Twitter for Android » (153 355 tweets) et « Twitter for iPhone » (107 064 tweets) sont les plus utilisées. Derrière nous retrouvons, « Twitter for iPad » (22 608 tweets), « Twitter Lite » (application web mobile de Twitter qui permet de tweeter via mobile sans passer par les applications iOS ou Android — 20 366 tweets) et « Facebook » (14 398 tweets).

Deuxième constat, qui découle du précédent, ces sources ont contribué à l’émission de 505 053 tweets de notre corpus de 566 302 tweets organiques.

Seuls 62 249 tweets, donc 11% du corpus, ont été émis via d’autres services, du type « Tweetdeck » (9 726), « IFTTT » (8 458), « dlvr.it » (5 002), « Buffer » (933).

Avec une focale plus précise sur l’écosystème en bas à gauche (en excluant du coup « TweetDeck », « IFTTT » et « dlvr.it »), on obtient le graphique suivant :

Des solutions comme Echobox Social sont essentiellement utilisées par des médias, dont Le Monde, L’Obs, L’Express, Le Figaro, Le Point, Libé ou encore 20 Minutes par exemple. Ce sont des outils de publishing qui permettent notamment de créer une passerelle intelligente, à base d’IA, entre le site internet et les comptes réseaux de médias.

Si l’on se fie aux éléments de communication de cette solution, nous avons grosso modo la définition d’un…bot ! :) Un bot qui semble en l’état être uniquement accessible aux médias.

Cette solution permettrait notamment d’aider un rédacteur et ou un community manager à trouver automatiquement le bon # pour son tweet ou son post Facebook. Les publications pouvant être faites soit de manière manuelle, soit comme il est précisé, en délégant le publishing à Echobox.

Toujours dans l’écosystème médiatique, on relève notamment une application (?), solution (?) ayant été utilisé à 94 reprises, et qui s’appelle « RT News Sharing ». Nous n’avons pas trouvé d’informations la concernant et pouvant nous permettre d’appréhender son modèle de fonctionnement. Le fait est qu’elle a été utilisée par quarante comptes pour relayer du contenu provenant de l’écosystème Russia Today, pour un nombre d’engagements total de….167 likes + retweets. Soit un chiffre négligeable par rapport au nombre total d’engagements.

Les comptes qui utilisent cette solution/application sont tous globalement sous pseudonyme, et l’analyse de leur bio Twitter met en avant un positionnement proche de l’extrême droite. Nous ne relevons aucun pattern au niveau des dates de création laissant penser que ces derniers aient pu être créés en même temps. Au contraire, nous avons affaire à une véritable ventilation en termes de création depuis le début de l’année 2008.

De même, sur Twitter il est impossible de créer une application dont le nom aurait déjà été « déposé » par un autre utilisateur. Par exemple, on ne peut pas créer un accès API du type « Twitter for iPhone ». Ce faisant, « RT News Sharing » apparaît donc comme un service tiers, auxquels viennent se plugger certains comptes. En l’absence de détails plus précis sur ce point, nous sommes obligés de nous en tenir à des conjectures ; mais quoi qu’il en soit, son influence est marginale. Ce n’est même pas une goutte d’eau dans un verre d’eau. Mais plutôt une goutte microscopique, qui ne saurait ni altérer la couleur, ni le contenu, dudit verre.

A titre purement informatif, et les comptes étant tous sous pseudo, nous nous permettons de publier le tableau ci-contre, il apparaît que 11 des 40 comptes qui utilisent cette solution/application font partie de notre liste des hyperactifs (n > 40).

Là encore, nous avançons cet élément comme une constatation d’ordre purement factuel, et nous rappelons que « RT News Sharing » n’explique aucunement leur « hyperactivité ».

Au rang des solutions/applications qui se signalent en analysant en détail ce corpus, nous retrouvons notamment « PressMediaNews ». @jeanloque, l’un des utilisateurs les plus actifs durant l’affaire, a ainsi publié plus de 1500 tweets via cette solution. La plupart de ses publications totalisent des engagements très faibles, voire inexistants. Seul fait d’armes pour lui, un top tweet le 27 juillet. Son tweet n’est pas éditorialisé, c’est une simple reprise d’un article paru dans Gentisde, avec un titre très accrocheur (de la part du média). Cela pourrait expliquer cette rupture en termes d’engagements, mais n’en fait pas pour autant un compte influent (il n’a que 530 abonnés).

C’est un spammeur davantage qu’un influenceur. D’ailleurs, on voit bien qu’il ne fait pas attention à sa ligne éditoriale, et qu’il laisse un « algo » décider, comme l’indique la capture d’écran de gauche.

Dans une logique somme toute similaire au compte que nous venons d’analyser, le @razki030775 (920 abonnés), n’a publié que des tweets automatisés sur l’affaire Benalla via IFTTT ou dlvr.it.

Cela pose la question du spam sur la plateforme, mais là encore ce n’est que du spam. Sur un compte comme @razki030775, l’influence est littéralement imperceptible, avec 17 engagements pour 460 tweets publiés.

Nous n’avons certes pas pu analyser une par une chacune des sources d’émission non classiques. Pour autant, si l’on se rappelle du fait qu’une part majeure des tweets sur l’affaire provient de sources classiques, et que dans les sources non-classiques on trouve soit des solutions dédiées pour des médias, soit de l’IFTT, Zapier ou encore dlvr.it qui font du partage automatique d’articles, on arrive assez vite à un constat factuel :

Il est difficile de mettre au jour une (ou plusieurs) applications malveillantes à même de cadrer et de structurer une conversation d’une telle ampleur.

Cela ne veut pas dire que dans la masse, un (ou plusieurs) bot(s) russe(s) ne peuvent être trouvés. En cherchant une aiguille dans une botte de foin avec patience et persévérance on finira bien par la trouver. Mais même en la trouvant, peut-on considérer que ladite aiguille soit à même de modifier la masse, la physionomie, l’apparence et la structuration organique de l’agrégat de pailles ?

Dès lors, partant de ce constat, passons de l’analyse microscopique à une approche macroscopique, et intéressons-nous à l’activité des médias russes francophones.

RT et Sputnik se sont-ils signalés dans l’affaire par une volonté manifeste d’injecter des éléments à même de servir un narratif correspondant à des enjeux géopolitiques ?

L’étude du think tank EU Disinfo Lab et sa focale mise sur les comptes russophiles, nous amène de facto à nous intéresser également à l’activité des médias russes eux-mêmes dans le cadre de l’affaire. En effet, quand on parle de « bots russes » irrémédiablement sont abordés les cas RT et Sputnik. Dès lors quid de leur activité et de leur appréhension du sujet ?

Pour analyser l’influence de ces deux médias nous avons opté pour une approche par le biais de l’émission. Via un script nous avons scrapé les articles relatifs à l’affaire Benalla publiés par RT France et Sputnik France ; nous avons fait de même avec Le Monde (à l’origine de l’affaire) et BFM TV afin d’avoir des médias « neutres » (évidemment que la neutralité axiologique en termes de journalisme est incongrue, mais par neutre nous entendons : peu suspects d’accointances avec la Russie) à titre de comparaison.

Au niveau du nombres d’articles publiés au 4 août :

· Le Monde : 196 articles

· BFM TV : 157 articles (les vidéos n’ont pas été scrapées, mais à titre indicatif, nous signalons que BFM en a publié 348 sur le sujet)

· RT France : 94 articles

· Sputnik : 63 articles

De manière purement quantitative, et comme l’indique le graphique ci-dessus, il apparaît pour le moins hasardeux de mettre en avant une hyperactivité des médias de l’écosystème russe dans le cadre de l’affaire Benalla.

Laissons de côté l’approche purement quantitative, et basculons au contraire dans une approche accordant la primauté à l’analyse sémantique. Pour ce faire nous avons réalisé un word frequency sur les titres des articles des quatre médias étudiés afin de déterminer les mots le plus souvent utilisés dans les titres.

Cette approche n’est pas exempte de limites et de biais, mais nous partons d’un postulat assez simple : plus un article est un clickbait plus il a de chance d’être partagé dans le cadre d’une effervescence conversationnelle type affaire Benalla.

A travers le graphique ci-dessus qui représente le top 20 des mots les plus utilisés par source (en retranchant les items « affaire » et « benalla », pour diminuer le bruit), on constate que Sputnik par exemple a utilisé de manière récurrente le mot « censure »….pour parler des motions de censure déposés par l’opposition.

Seule exception, un article revenant sur l’affaire Nordpresse et un autre plus généraliste sur l’évolution de la tolérance de Twitter à l’égard de certains comptes outrepassant les CGU. Même constat pour RT France où l’utilisation du mot « censure » ne vient pas qualifier, comme d’aucuns l’ont prétendu au plus fort de la crise, une prétendue censure étatique mise en place par la majorité avec la complicité de Facebook et de Twitter, mais bel et bien la motion de censure en question. Là encore un article a été consacré au cas Nordpresse. La plupart des médias français traditionnels ont également consacré de la visibilité concernant ce sujet, donc il apparaît difficile de considérer que les deux médias russes ont amplifié la couverture des problèmes rencontrés par le site parodique belge.

En termes des personnalités mentionnées, on constate que Sputnik a mentionné Jean-Luc Mélenchon à 3 reprises, donc on a ici une légère surreprésentation de JLM par rapport aux trois médias étudiés.

Dernier élément l’analyse de l’engagement suscité par les 4 médias étudiés, ne permet pas de conclure à une capacité de RT et Sputnik à rivaliser avec les contenus émis par BFM TV, ou dans une moindre mesure Le Monde. A ce titre, Sputnik réalise sur le sujet des engagements relativement faibles. RT réalise pour sa part un nombre d’engagements plus conséquent, s’inscrivant dans un ordre de grandeur proche du Monde.

Par rapport à l’engagement total suscité par l’ensemble des tweets de notre corpus (soit 6 447 609 engagements), les 4 médias étudiés ont contribué à environ 2% de l’ensemble des engagements (124 319 engagements).

Sputnik compte pour 0,036% de l’engagement total.

RT compte pour 0,22% de l’engagement total.

Le Monde compte pour 0,28% de l’engagement total.

BFM TV compte pour 1,38% de l’engagement total.

Dès quatre médias étudiés, c’est donc davantage BFM TV qui a suscité un nombre significatif d’engagements que l’écosystème des médias russes.

Quoi qu’il en soit, au vu de ces éléments il apparaît pour le moins ardu de mettre au jour un cadrage sémantique impulsé par les médias russes dans la couverture de l’affaire. Une hyperactivité aurait pu être un signe d’une volonté d’injecter un maximum de contenus pour nourrir la controverse, or dans les faits ils ne se signalent pas par une forte activité (par rapport à leurs pairs). Quant aux éléments présents dans les titres, difficile d’y voir la volonté de désinformer et/ou de faire le jeu de Moscou.

Si l’on résume par l’absurde, il y a plus de chance que Le Monde ait fait le jeu de Moscou dans cette affaire, que les médias russes en question.

La data n’est pas une science exacte mais elle a le mérite notamment via les dataviz de présenter de manière synthétique des données hétéroclites et variées. Cela nous permet de dire avec une marge d’erreur relativement faible que :

· Non RT et Sputnik n’ont pas joué un rôle déterminant dans l’amplification de l’affaire

· Non RT et Sputnik n’ont pas répandu de fake news

· Non RT et Sputnik n’ont pas fait du clickbait pour critiquer le PR et LREM

Et pourtant, cela n’a pas empêché des personnalités politiques comme Frédéric Lefebvre de mettre en avant l’idée d’une « manipulation d’ampleur », qui en filigrane, viendrait de Russie.

Dans le courrier adressé par Frédéric Lefebvre à Philippe Bas, deux paragraphes ont attiré tout particulièrement notre attention :

Sans rentrer dans les détails, il est pour le point inquiétant de voir un ancien responsable politique mettre sur l’agenda la question d’une campagne de désinformation potentiellement orchestrée par une puissance étrangère sans avoir eu accès à une étude détaillée. Réagir sur la base d’un simple communiqué de presse est pour le moins étonnant.

En utilisant la phrase « la source de cette désinformation », et en prenant le parti d’utiliser le singulier plutôt que le pluriel, Frédéric Lefebvre, pour ce qui le concerne, tend en effet à mettre en place un narratif qui comme nous avons essayé de le démontrer dans cette étude ne résiste pas à une analyse poussée des datas brutes.

L’analyse de l’opinion appliquée aux controverses politiques/géopolitiques est-elle fiable ? Les chercheurs/analystes ne sont-ils pas enclins à s’adonner au clickbait pour maximiser leur visibilité ? N’assistons pas au contraire à l’utilisation de la data au service de stratégie d’influence ?

Quand nous parlons d’ « études » de type clickbait dont malheureusement certains médias se font trop rapidement l’écho, nous pensons notamment à celle réalisée par un institut madrilène qui expliquait que pendant le référendum catalan l’activité des bots russes a augmenté de 2000%. Pourquoi ce genre de chiffres est complètement fallacieux :

1 Si l’on veut calculer l’augmentation de l’activité d’un compte Twitter on procède de la sorte : 1) on isole une période donnée 2) on détermine un univers sémantique associé au sujet que l’on souhaite activité 3) on compare avec t-1. Et en faisant cela sur un compte ou par exemple un listing de comptes (par exemple les militants de La France Insoumis dont l’extémité est telle qu’ils sont aisément catégorisables) on peut en effet en venir à des conclusions du type : « Monsieur Duchemol a augmenté son activité de 30% dans le cadre de l’affaire Benalla, par rapport à son niveau moyen de tweet, ou encore les militants de LFI ont vu leur activité progressé de 60% au cours de l’affaire Benalla ».

2 Sauf que là où le bât blesse c’est lorsque l’on tente d’appliquer cela cette logique à des bots Russes. Cela devient éminemment questionnable parce que :

  • Cela présuppose d’avoir une liste précise et détaillée des bots russes, constamment mise à jour
  • Cela suppose qu’on ait la certitude que les comptes en question soient russe
  • Les données de géolocalisation sur Twitter sont déclaratives donc ne peuvent aucunement rentrer en ligne de compte
  • Seul Twitter dispose de l’IP avec laquelle un compte se connecte
  • Les analyses par fuseau horaire, loin d’être inintéressantes, minimisent pourtant plusieurs paramètres : 1) Si les Russes font vraiment des bots il suffit de quelques lignes de codes en python, en R, ou en java, pour casser le pattern horaire. 2) La plupart des CM utilisent bien des solutions comme Buffer et Hootsuite pour paramétrer la publication d’un tweet à une date prédéfinie 3) On touche également du doigt la question du false flag. Le pattern horaire étant un marqueur tout à la fois temporel et identitaire, rien n’empêche une puissance étrangère, une entité ou un individu, de se caler sur le fuseau horaire de Moscou tout en opérant pour le compte d’une autre puissance.

Tout cela pour dire que l’analyse de données appliquée à l’étude de controverse est depuis quelques années sur une pente pour le moins douteuse.

Le sujet est douteux car certains acteurs sont en train d’utiliser l’analyse de réseaux au service de logique d’influence. En d’autres termes, et c’est un sujet sur lequel nous travaillons depuis plusieurs mois, mais il s’avère que de plus en plus d’acteurs et/ou des gouvernements utilisent la data science à des fins d’influence et/ou de contre-influence.

A titre d’exemple pour étayer cet élément :

· Sur le cas de la Catalogne, El Real Instituto Elcano, un think tank positionné sur les enjeux relatifs aux relations internationales, avait mis au jour une hausse de l’activité des bots russes de 2000% lors du référendum catalan.

· Dans une conférence de presse d’avril 2018, la porte-parole du Pentagone, expliquait que les frappes en Syrie ont donné lieu à une hausse de 2000% de l’activité des « Russian trolls ».

Dans les deux cas en question, nous ne sommes pas sur des faits type affaire Benalla par exemple, mais sur des événements avec de forts enjeux géopolitiques. Dans un cas, on parle d’une ingérence étrangère pour fausser un référendum dans une démocratie européenne, de l’autre d’une potentielle weaponization of the information pour riposter dans le digital aux frappes en Syrie.

Or dans les deux cas, et bien que les sujets soient diamétralement opposés tant en termes de volumétrie conversationnelle que d’enjeux géopolitiques, ce sont les mêmes chiffres qui sont avancés, respectivement par un think tank et une porte-parole du Pentagone.

Du fait des volumes de data en question ces chiffres sont bien souvent invérifiables, et les services data des médias digitaux n’ont pas forcément le temps humain d’analyser des corpus de dizaines de millions de tweets.

Or, et pour conclure sur ce point, comme dans le cas de l’étude publiée par EU Disinfo Lab, nous avons affaire avec ces deux exemples spécifiques, à des communications basées sur des chiffres et des assertions qui ne vont pas sans soulever un nombre considérable de questions, et qui surtout, et c’est peut-être là le point le plus significatif, ne sont pas dénuées d’influence politique et législative.

Pour conclure, et en guise d’ouverture, nous renvoyons vers un court article paru dans Gizmodo[vi] (un site dédié l’actualité tech) en avril 2018, et qui pointait du doigt les limites évidentes de ce type de statistiques :

« For one, the actual thing allegedly being referenced, an “increase in Russian trolls,” is vague enough to mean just about anything. For example, does that number include Russian state media? Is it a reference to sheer number of posts, in which case it would be good to know how those posts are supposedly being identified? Or is it a measure of something like impact or engagement, which is even more problematic because those metrics are usually bullshit? Moreover, how do we even know that said engagement — assuming that is what is being measured — is shifting the discussion around the Syrian intervention in any way favorable to the Russian government?

“I think there’s a basic reality check you can do on most statistical claims,” Tim Hartford, host of statistics podcast More or Less, told Vice. “You can just ask: Does that sound reasonable? … OK, so first, if you’ve been given a number, just ask: compared to what? … The second thing is — what does the statistic actually refer to?”

This being the Pentagon, it’s entirely possible this is sourced to some kind of intelligence gathering by the US. But as BuzzFeed noted in February, the source of virtually every story blaming Russian bots for some situation or another is Hamilton 68, a group which tries to track “Russian influence efforts online.” This more or less essentially boils down to a page full of the kind of meticulously gathered, but not necessarily meaningful and easily misinterpreted, metrics that anyone should be suspicious of when they come up in a discussion »

[i] http://tvmag.lefigaro.fr/programme-tv/l-affaire-benalla-dope-les-audiences-des-chaines-d-information-et-de-lcp_912d850a-8f51-11e8-a5d8-a0f88e18625a/

[ii] Ce qui n’empêche pas les comptes privés de pouvoir partager et liker du contenu public, et ainsi de contribuer de manière non négligeable, non pas tant au relai d’un contenu, qu’à ses statistiques purement quantitatives

[iii] Dans un article publié le 27 juillet dernier, Guillaume Jacquot, journaliste à Public Sénat, revenait sur la soudaine popularité des sénateurs suite à la commission d’enquête ouverte par le Sénat. Parmi les sénateurs tirant leur épingle du jeu à l’occasion des auditions, le chiraquien et ex-SG de l’Élysée Philippe Bas, au même que le sénateur PS Jean-Pierre Sueur, est devenu un meme sur les réseaux sociaux, et plus particulièrement sur le forum 18–25 de jeuxvideos.com. Ce sujet est beaucoup trop périphérique par rapport à cette étude spécifique, mais il nous semble intéressant de pousser plus en avant les nouvelles formes d’appréhension de la politique émanant de franges spécifiques de la population française. Cet intérêt des utilisateurs du 18–25 pour le travail sénatorial, qui n’est certes sûrement pas déconnecté d’une forme de fascination morbide pour l’inversion momentanée des rapports de forces, ouvre des lignes de fuites intéressantes quant à l’évolution du discours sur le/la politique notamment des jeunes. Le forum de JVC est difficile à exploiter en analyse de données, notamment parce que le site ne propose pas d’API, toutefois selon Guillaume Jacquot, « en sept jours, le fil consacré à cette actualité hors-norme affiche près de 36.000 messages ». Une activité qui donne à penser que les Français, et notamment les plus jeunes, ne se sont pas totalement désintéressés du sujet, n’en déplaisent aux assertions soit hâtives soit maladroites de quelques pythies ès réseaux sociaux gravitant dans l’entourage de la majorité. https://www.publicsenat.fr/article/parlementaire/des-senateurs-deviennent-des-phenomenes-internet-sur-le-forum-jeuxvideocom

[iv] Lire à ce propos : https://help.twitter.com/fr/rules-and-policies/twitter-reach-limited

[v] Ce chiffre s’obtient par le calcul suivant : (hyperactifs / ensemble des utilisateurs) * 100, soit (2 232 / 111 050) *100

[vi] https://gizmodo.com/how-did-the-pentagon-quantify-this-bizarre-statistic-on-1825268639

--

--

Damien Liccia
damien-liccia

Associé et CTO IDS Partners | Vice-président OSI | Rstats & 🐍