La démocratie piratée

Une campagne de désinformation de grande ampleur et Pro-Le Pen a frappé Twitter, 4chan, et les médias traditionnels

Mickael Gaspar
Data for Democracy
9 min readMay 15, 2017

--

De Kris Shaffer, CE Carey, et Ben Starling (traduit par Mickael Gaspar)

Les utilisateurs de Twitter ont pu remarquer quelque chose d’étrange lors de la dernière ligne droite avant le second tour de l’élection présidentielle en France qui s’est tenue dimanche dernier. Des hashtags tel que #SortonsMacron, #RejoignezMarine [Le Pen], #Macrongate, et #Bayrougate ont fait leur apparition sur Twitter où ils ont commencé à émerger à plusieurs reprises. Le Digital Forensics Research Lab a rapporté que, jusqu’à récemment, la tendance de ces hashtags restait cantonné dans des groupes de comptes Twitter relativement isolés. Toutefois, au cours de la semaine dernière, nous avons surveillé l’activité sur plusieurs plateformes web et nous avons constaté que les efforts de désinformation y ont connu une recrudescence, en particulier sur Twitter et 4chan, et qu’ils ont fait leur apparition dans les médias traditionnels, ainsi que dans le débat présidentiel de l’entre deux tours. Il s’agit là d’un effort coordonnée et significatif qui visait à orienter le scrutin, via la sphère numérique, en faveur de la candidate d’extrême droite Marine Le Pen. Cette démarche est de même nature que celles qui ont été observées au cours de l’élection présidentielle américaine, ainsi que du référendum sur la sortie de l’Union Européenne au Royaume-Uni.

Twitter

Sur une période 24 heures entre le 4 et le 5 mai, nous avons collecté et analysé un flux de plus de 1 million de tweets en lien avec l’élection présidentielle en France. (Les termes de recherche incluaient plusieurs orthographes pour les noms de Le Pen et de Macron, et les hashtags #LeDebat2017, #2017LeDebat, et #Presidentielle2017.) Voici ce que nous avons découvert. (Nous vous prions de noter que, par respect pour la vie privée de chacun, nous n’avons publié aucune information spécifique à un utilisateur de Twitter qui pourrait permettre de l’identifier.)

Qui twitte ?

Dans notre base de données agrégeant ce million de tweets, nous avons trouvé quelques comptes très prolifiques. 5% des utilisateurs comptabilisent à eux seuls près de 40% des tweets. Le compte le plus prolifique a twitté 1668 fois sur la période observée par notre jeu de données (c’est à dire à peu près 24 heures) ― c’est plus rapide qu’un seul (re)tweet par minute, sur une journée entière sans dormir. Bien que ce soit humainement possible pour un utilisateur extrêmement motivé, nous avons observé dans le détail ce compte ainsi que d’autres ayant un très haut débit au cours de la journée étudiée et, pour nombre de ces comptes, les tweets arrivent par rafales bien trop rapides pour qu’une personne puisse tenir un tel rythme, suggérant une automisation plutôt qu’un être humain très actif. Ces comptes dénotent aussi d’autres traits cohérent avec l’hypothèse de bots automatisés : une bannière d’images exagérément patriotiques, des photos de profil volés ailleurs sur le web, une date d’inscription récente combinée avec un important volume de tweets, etc. Il est donc évident qu’une partie significative de ces contenus ― en particulier parmi les comptes ayant la plus grande volumétrie ―provient de bots.

En revanche, peu de ces comptes particulièrement prolifiques twittent du contenu original. Presque tous vont soit retwitter le contenu de comptes “catalystes”, soit répondre à d’autres tweets avec un message unique, répété constamment (en général un mémé ou une image avec du texte), soit cité d’autres tweets en y ajoutant un message unique, répété constamment.

Qu’est-ce qu’ils twittent ?

Ce qui surprend en comparant avec l’élection présidentielle américaine et le vote sur le Brexit (où les bots étaient massivement en faveur des mouvances de droite), c’est que cette fois nous avons découvert aussi bien des bots pro-Le Pen que des bots pro-Macron. Nous avons même remarqué un bot encourageant la participation à l’élection et qui ne semblait favoriser aucun des deux candidats.

Bien que la présence de bots soit avérée de chaque coté, nous avons aussi pu établir l’existence d’une importante campagne de désinformation visant spécifiquement à discréditer Macron et à encourager le vote pour Le Pen. Dans le graphique suivant, on peut voire les bigrammes (des séquences de deux mots reprises dans le contenu écrit, après qu’on ait retiré les mots courants tel que a, an, the; la, le, les; etc.) qui sont les plus distinctifs dans les tweets mentionnant un des deux candidats.

Les bigrammes les plus caractéristiques parmi un million de tweets sur une période allant du 4 au 5 mai.

Plusieurs éléments ressortent de cette analyse. Premièrement, il y a une part significative de contenu en langue anglaise dans les tweets portant sur cette élection. Cette élection a eu un retentissement international, mais on est tout de même ici face à un nouveau phénomène. Au cours des premières heures de ce flux de tweets, les ensembles de termes les plus distinctifs des tweets sur Le Pen avaient une proportion très significative de leur contenu en anglais ou en espagnol, alors que les ensembles de termes les plus distinctifs des tweets sur Macron étaient presque exclusivement en français (comme on peut le voire sur le graphique en-dessous). L’accroissement a été un événement nouveau qui n’est advenu que plus tard.

Les bigrammes les plus caractéristiques parmi 400,000 tweets datant du 4 mai.

On peut aussi signaler que les tweets sont généralement dominés par du contenu en langue française. Selon nos estimations, près de 80% des tweets sont écrits en français, et seulement 20% le sont en anglais. Le fait que le contenu le plus distinctif pour chacun des candidats tendent à être plus fréquemment en anglais est révélateur. Sans d’autres analyses plus approfondies, il est difficile d’avoir des certitudes, mais il est possible que les utilisateurs anglophones de Twitter aient à tout le moins essayé d’orienter l’arc narratif de chacun des candidats, ou d’introduire sciemment de nouveaux éléments narratifs. Qu’ils aient ou non réussi est une autre histoire, mais après Trump/Clinton et le Brexit, nous ne prenons plus rien pour acquis, et nous recommandons de prendre au sérieux toute tentative de désinformation ou de prise de contrôle de la narration (du “story-telling”).

Il y a aussi un changement net dans le contenu principal de ces tweets. Au cours de la soirée du 4 mai, les tweets sur Macron se concentraient sur le ralliement de Barack Obama à sa candidature, alors que les tweets sur Le Pen étaient dominés par les jets d’oeufs que la candidate venait de subir au cours d’un meeting de sa campagne. En revanche, le matin du 5 mai (sur le fuseau horaire de la côte est des États-Unis), la tendance des tweets sur Macron avait drastiquement changé, avec un nouveau focus sur sa corruption supposée, incluant des accusations d’évasion fiscale via un compte offshore dans les Iles Caïmans.

Cette accusation de corruption, que certains ont dénommé #Macrongate, est une campagne délibérée de désinformation, qui s’est propagée au travers de multiple réseaux sociaux, amplifié par des bots et des “influenceurs”, réussissant même à faire son chemin jusqu'à un débat présidentiel, et désormais jusqu'à une cour de justice française. Le 6 mai, le jour même de la publication de cet article, est venu s’y ajouter une fuite massive de mails privés censés appartenir à l’équipe de campagne de Macron, rapportée par les médias traditionnels internationaux ―trop importante pour que les médias l’ignorent, mais trop tard pour que quiconque puisse les examiner de près et s’assurer de leur véracité ou de leur authenticité, et juste quelques minutes avant le début de la période de silence électoral, au cours de laquelle les candidats n’avaient plus le droit de faire de déclarations et de répondre aux médias jusqu’à l’ouverture des bureaux de vote.

#Macrongate

Quand nous avons vu 4chan et pol (le comité “politiquement incorrect” dans 4chan) apparaître dans la liste des termes les plus distinctifs des tweets mentionnant Le Pen, cela a attiré notre attention. Nous avions déjà vu des références à Le Pen émerger d’une relative obscurité sur 4chan en avril, pour atteindre le top 10 des bigrammes au cours des derniers jours. 4chan a joué un rôle-clé dans l’élection de Trump, ayant produit et servi de ballon d’essai à plusieurs mémés anti-Clinton, pour ensuite resservir ceux qui avaient le meilleur taux de réponse dans le sous-reddit The_Donald, qui était alors suivi par l’équipe de campagne de Trump pour y piocher du matériel pouvant être réorienté vers les canaux des réseaux sociaux plus traditionnels.

Nous avons regardé spécifiquement les plus de 2000 tweets dans notre archive qui mentionnaient 4chan. Bien que cela ne représente qu’une goutte dans l’océan sur Twitter, il s’avère que ces tweets sont la clé d’une controverse majeure. D’après le journaliste de BuzzFeed, Ryan Broderick, les utilisateurs de 4chan ont propagé l’information (démentie depuis) que Macron aurait utilisé un compte offshore dans sur une banque des Iles Caïmans pour éviter de payer ses impôts en France. En remontant le fil de cette histoire, Broderick a aussi trouvé des preuves que des utilisateurs de Reddit avaient sciemment répété des expressions identiques sur cette théorie du complot afin de “bombarder Google” ―d’alimenter avec du faux contenu, et reproduit mot pour mot, des sites où Google puise pour alimenter l’algorithme de son moteur de recherche, dans l’espoir que cela influencerait les expressions utilisées par Google dans sa fonction d’autocomplétion pour les recherches commençant par “Macron”.

Bien qu’il y ait beaucoup de confusion dans 4chan sur l’authenticité de ces soupçons, ou sur l’idée même que leur authenticité ait un tant soit peu d’importance, la rumeur s’y est répandue ainsi que sur Reddit, pour ensuite faire son chemin sur les autres réseaux sociaux et enfin atteindre les médias traditionnels français. Marine Le Pen y a fait allusion au cours d’un débat, accusant Macron d‘avoir recours à un paradis fiscal. Durant le débat, la tendance du hashtag #Bahamas s’est envolée, suite à ça. La conséquence a été que Macron a du répondre à ces accusations dans des interviews, de la même manière que Barack Obama a du répondre aux questions sur son certificat de naissance et Hillary Clinton sur son serveur privé de mails, et cela a obligé Macron à se détourner de ses thèmes de campagne bien que ce soit faux. Dans une élection serrée, même si la majorité des électeurs pensent que cette histoire est fausse, le fait que cela affecte son message de campagne peut suffire à redonner une chance de victoire à son opposante.

Arrive les bots

Quand la “révélation” du #Macrongate a fait son entrée dans le discours publique français, des bots Pro-Le Pen l’ont reprise sur Twitter pour l’amplifier. Par exemple, un message de désinformation à propos de cette histoire, “Are Emmanuel Macron’s Tax Evasion Documents Real?” (sur GotNews, on n’a pas fournit de liens à cet article pour des raisons éthiques) était devenu l’URL le plus partagé, en-dehors de ceux de Youtube, sur 4chan au cours de la période étudiée. Dans notre jeu de données sur Twitter, il a été partagé 1186 fois par 1066 comptes différents. Suite à une inspection manuelle, il nous ait apparu que les comptes qui ont partagé le plus fréquemment cet article ont démontré plusieurs traits propres à des bots (voire plus haut). Ce qui en dit le plus long est que 306 des 1066 comptes qui ont twitté/retwitté l’article de GotNews sont dans le top 1% des comptes quand on les hiérarchise par volume de tweet. Autrement dit, les bots les plus actifs ont partagé de manière disproportionnée des liens alimentant cette désinformation. Alors que les campagnes numériques plus génériques tel que #sortonsMacron et #rejoignezMarine, qui ont été analysé par le DFRLab, se sont avérées inefficaces, il semble que la campagne de désinformation sur l’évasion fiscale a réussi à faire une percée, et que des bot-nets d’extrême-droite ont cherché à capitaliser dessus, en essayant autant que possible de maintenir cette fausse information dans le débat publique jusqu’au jour de l’élection.

Le contrôle narratif

Il semble clair ici que l’objectif n’est pas la vérité, ni même la crédibilité (vous souvenez-vous du #pizzagate d’Hillary Clinton ?). L’objectif de ces réseaux de désinformation est de contrôler le déroulement de la narration. Maintenez la balle de l’autre côté du terrain et multipliez les tirs, même s’ils sont mauvais. Contrôlez la balle, maintenez vos adversaires sur la défensive, et ils ne pourront plus peaufiner leurs attaques. Et peut-être même qu’ils cafouilleront et laisseront passer le but de la victoire. C’est la tactique qu’applique tous ces réseaux de désinformation.

Alors que faisons-nous? On réclame la vérité. Ignorons le dernier déversement d’emails non-corroborés fourni par WikiLeaks. Apprenons à quoi ressemble un bot. Assurons-nous que chaque affirmation sans fondement a au moins plusieurs sources fiables. Encore mieux, commençons par aborder avec dédain ces affirmations sans fondement. Demandons aux journalistes de suivre des standards plus hauts, et quand ils n’arrivent pas à les atteindre, trouvons autre chose à lire. Et demandons à ce que les plateformes qui permettent la propagation en ligne de la désinformation et de la haine en soient tenues pour responsables.

Le web est à nous. La démocratie est à nous. Il est temps pour nous de récupérer les deux.

Image d’en-tête par Pedro Kümmel.

--

--