Qui veut la peau de Candice Delta ?

Sur les médias sociaux, tous les fakes n’ont pas de gros sabots : troisième et dernier volet d’une plongée dans un univers où les clones portent des chaussons de danse.

Uldus Bakhtiozina combat les clichés à coup de clichés et de clones en tutu

Dans un premier billet, Qui es tu Candice Delta ?, nous avons remarqué le lien entre des comptes Twitter visiblement bidonnés et le commerce du développement d’audience. Dans un deuxième texte, Recherche Candice désespérément, nous avons montré que les repères habituels pour détecter en masse les armées de clones étaient mis à mal par un commando de l’ombre. Enfonçons le clou, et avançons un encore un peu dans l’enquête collective sur Candice Delta (merci de m’aider à faire, à force de répétition, de ce nom celui de ce genre d’imposteurs), et mettons la en contexte.

Dans l’escalade sans fin entre le faiseur de faux et le démonteur de faux (à ce sujet, lire Experts et faussaire, et pas seulement parce qu’il a été réédité récemment dans une collection que je codirige…), il faut toujours trouver un compromis entre le temps passé à construire le faux et la difficulté à le repérer, et vice-versa. Ici une des limites réside ici dans l’API de Tweeter et en particulier dans les délais imposés entre les recherches. Mais en repérant des indices évocateurs, on peut simplifier les requêtes. Et c’est bien pourquoi, on pourra toujours se féliciter d’améliorer l’efficacité de la détection de fakes. Il ne s’agit pas évidemment de nier la performativité de la chose, mais bien de repérer qu’il s’agit d’un processus sans fin, les faussaires ayant pour réaction de limiter la sensibilité de leurs créatures à toutes nouvelles règles de détection.

Or, le genre Candice Delta est un compromis intéressant, parce qu’il repose sur la discrétion : profil “ultra-normal”, pas de spam, ne retweete qu’à 10–25% son maître. De même, pour éviter de dessiner un réseau trop dense, les membres de la bande évitent de se lier entre eux. Il s’agit d’éviter les croisement trop visibles.

Dès lors, quels indices utiliser ?

Peut-on voir dans cette comédie une unité de lieu ?

Selon leur profil, les Candice vivent en France, sauf quelques rares égarés (#Dublin 1, #Londres 1,#Angleterre 1, #Asie 1, Inde 1), on aurait pu s’attendre aux States, mais non… On en trouve évidemment à la Capitale (#Paris Paris parisienne 15), mais aussi dans des villes de bonne taille : #Strasbourg 4, #Grenoble 2, #Bordeaux 2, #Lyon 2, #Reims 1, #Nantes 1, #Toulouse 1, #Tours 1, #Lille Lille 2, #Rouen 1, #LaRochelle 1, Vannes 1. Enfin, si quelques régions sont mentionnées (#Savoie 1, #Bretagne 1), c’est surtout dans le Sud-Est que notre petite bande préfère établir ses quartiers : #Marseille Marseille Marseillaise 5, sud de la France #PACA le sud 3, #Corse 1, Aix-en-Provence 1, #Nîmes 1). Un rapport de proximité avec la localisation marseillaise de l’entreprise de growthhacking a priori à l’origine de ces profils.

Plus riche d’enseignements, un tri par leur date nous montre que les comptes attrapés ont été créés entre le 3 mai et le 6 juillet 2016.

Nombre de profils par jour de création

Sur cette période, la production n’est pas effrénée, à chaque jour suffit sa peine, d’autant que graphiquement on voit carrément apparaître les vides laissés par les weekends (on serait même tenté de dire qu’à Marseille, les semaines de travail font souvent 3 jours…). On peut donc légitimement émettre l’hypothèse que ces comptes sont créés “à la main”, par des salariés. En y regardant de plus près, on s’aperçoit que les premières fournées sont exclusivement féminines, et que les profils masculins n’apparaissent que mi-juin. S’agit-il d’une perte d’inspiration ou de compenser un manque de parité ? S’il fallait expliquer l’étroitesse de cette période, on pourrait avancer qu’un faible nombre de fakes est à la fois suffisant et gérable, ou plus simplement que notre script n’a pas repéré tous les éléments du gang.

En définitive, le pattern commun le plus marquant à tous ces profils concerne l’entrée “source” des tweets. Tous les messages que l’on tweete sont en effet marqués du nom de l’outil utilisé. Ici, en analysant les 200 derniers tweets de chaque Candice Delta, on trouve trouve une distribution précise : ils utilisent exactement 2 sources : TweetDeck pour 12 ou 13 tweet, et un script pour tous les autres. Ce dernier porte un nom unique, plus ou moins de la forme “candicedeltaApp”, même s’il y a de fortes chances pour qu’il s’agisse du même à chaque fois.

On voit donc que nos fakes émettent des tweets tantôt comme des bots, tantôt via l’utilisation de TweetDeck par un agent humain. Aussi, vu le nombre de compte repérés, il leur serait facile de tweeter de temps à autre un contenu à caractère « domestique », de le faire depuis une troisième source (ou de changer le nom de celle-ci dans le code), et faire tomber le filtre de mon script.

Tout le monde ment pour se vendre sur les médias sociaux, alors pourquoi s’énerver ?

Quel est donc le problème soulevé par ces fakes ? Pas le fait qu’il soit partiellement automatisés.

Les bots sur Twitter constituent une ressource importante, ils permettent le relais automatique d’information. De plus, les médias sociaux se construisent sur un entrelacs humain-machine (dans lequel se développe une contre-intelligence artificielle, néologisme dont j’aurais certainement l’occasion de reparler dans un autre billet). Mais ici on prétend à une figure humaine, et il y a donc tromperie, même si elle se base beaucoup sur notre tendance à être très charitables dans le followback. Qui donc est vraiment intéressé à suivre de tels profils plats et leurs tweets qui sont tout sauf originaux ?

Le souci réside-t-il dans le fait qu’il s’agisse de faux profil ?

Même pour les profils vérifiés, un compte Twitter n’est censé afficher que ce qui appartient à la carrière d’une image publique, et non pas d’être un double exact (sur la question des avatars, je vous renvoie à Les Liaisons numériques. Vers une nouvelle sociabilité? d’Antonio A. Casilli). Et pour ce qui est des personnalités publiques, on s’attend à ce qu’elle soit conduite non par les intéressés mais par leur community managers. C’est ce qui permet a contrario de prétendre à une expression directe, par exemple quand on est président des États-Unis et qu’on n’a de cesse de mettre en scène un usage forcené de Tweeter pour donner un tel sentiment…

En fait, la construction d’un “soi” dans les médias sociaux est un processus qui se joue sur plus d’un niveau (voir par exemple C’est compliqué de danah boyd), et dans lequel au final, il faut apprendre à lier, d’une même perche à selfie, l’importance de l’avant plan et de l’arrière plan (voir le blog de Laurence Allard). D’ailleurs, si vous voulez gonfler votre existence numérique et devenir une star du web, il va falloir bosser dur et ne pas craindre d’investir, comme le montre l’enquête du journaliste Max Chafkin (merci à @Nolwenn_Guellec pour le lien).

Qui et dans quel but ? se révèlent des question plus intéressantes. On a déjà cité le cas de la blogueuse syrienne gay qui était en fait le montage d’un couple américain. On pourrait évoquer également celui de Jean-Pierre Tremblay, auteur fictif d’un article bidon et bidonnant, “Automobilités postmodernes : quand l’Autolib’ fait sensation à Paris”, publié dans la revue d’une école de la sociologie française que l’imposture entendait mystifier. Le personnage a son propre profil Twitter, @JeanPieTremblay, qui continue à faire vivre l’affaire. Sur les médias sociaux, comme ailleurs, le faux et son dévoilement font partie du jeu de vigilances, individuelle et collective, que l’on se doit d’exercer pour, employons un gros mot, conserver une agency sur son monde. S’il faut en croire la lecture de Cory Doctorow, méfions-nous des systèmes qui n’ont pas de parasites

Un autre point réside dans la question de l’intérêt économique de la chose. Il y a des personnes et des entreprises qui payent pour avoir des followers et des RT, pour développer du capital social numérique (voir [E]réputation : médiation, calcul, émotion de @CaddeReputation, ne serait-ce que pour l’excellente synthèse du chapitre 2 “Le Web, ses sociabilités et son traitement informationnel”). On se rassure, ceux qui participent ne sont pas dupes quant à l’authenticité d’une partie de leur réseau et aux méthodes utilisées. Mais il est pourtant bien question de rétribuer pécuniairement un effet. Comment mesure-t-on sa portée quand on ne sait pas y évaluer la part du vrai et du faux ? Comment démonter la boite noire de la viralité par le fake quand on est en bout de chaîne, qu’on a juste comme retour les graphiques prometteurs du consultant ?

En ces temps d’élection, on en vient aussi à s’interroger sur les effets de ces jeux de dupes sur la démocratie, puisque nos politiques les utilisent allègrement(@AntoineProvo annonce des taux allant jusqu’à 35%). Il serait donc sain pour le citoyen, pour le journaliste politique, pour le politiste, … enfin pour chacun d’entre nous, de pouvoir estimer la part des bots, des fakes et autres joyeusetés dans les chiffres d’audience des médias sociaux qu’on nous propose.

Vous aimez les histoires de fake ? en voici une autre : L’attaque des groupies agricoles.