Déplier les données — De l’usage des données dans le champ journalistique

Intervention de Skoli lors du WebComeLyon, le OFF de The WebConf2018.

Le journalisme est en crises. Crise commerciale, crise de confiance, crise aussi de représentativité quand ils n’ont su voir la victoire de Trump, du Brexit et avant cela du ‘non’ au Référendum de 2005. Les débats sur les Fake news agitent la sphère politique au point qu’une loi sur le sujet est en préparation. Pour lutter contre ces différents processus, la pratique du fact-checking envahit le monde médiatique. Des célèbres Décodeurs du Monde, au Checknews de Libération. Les médias associatifs proposent désormais à leurs communautés de vérifier en direct les faits avancés par leurs invités. S’il peut s’agir de vérifier des éléments très tangibles, ces actions de vérification peuvent toutefois devenir problématiques si elles restent aveugles sur leurs utilisations des données. Elles postulent l’existence de faits et d’une réalité totalement objectivable par la mesure. Le paroxysme de cette tendance est dans l’utilisation des data comme éléments journalistique sans questionnement sur les dimensions historiquement et socialement situées de ces écritures.

Qu’est ce qu’une donnée ?

Il ne s’agit pas ici d’une interrogation technique. La donnée c’est une mesure, une médiation entre le monde sensible et notre esprit, une transcription, une écriture de la réalité mesurée. Bref, un media, un écran entre les expériences sensorielles immédiates (“immédiales” chez Y.Citton) et les enregistrement de celles-ci, soit tout ce qui sert à enregistrer, à transmettre et/ou à traiter de l’information, des discours, des images, des sons (Y.Citton). Déjà le philosophe Daniel Bougnoux nous appelle à une lecture critique ou une analyse systématique dans la mesure où les media ne fonctionnent efficacement qu’en se faisant oublier. Et en effet, le média seule représentation disponible de la réalité en devient le synonyme. Prenons la terrible photographie du petit Aylan. Elle est bel et bien une représentation de la réalité, mais cette image est fixe, cadrée, sans son, bref construite … Les conditions et choix matériels et humains qui président à l’enregistrement d’un événement dans la réalité sensible ne sont pas neutres. Ils construisent un nouveau fait.

Or le terme même de donnée ainsi que l’illusion d’une “neutralité mathématique” nous poussent à considérer celles-ci comme de simples enregistrements “neutres”, “objectifs” d’une réalité. Bruno Latour parle plus justement d’obtenues pour désigner ces écritures de la réalité, c’est ce que nous sommes parvenu à obtenir de la réalité. Les media sont par ailleurs un moyen d’expression mais aussi un milieu extrêmement influent sur nos perceptions, nos sensations. Yves Citton parle lui de Préhensions en ce que rien n’arrive sur un disque dur ou un serveur sans avoir fait l’objet d’un choix, et souvent d’un travail consistant à prendre (saisir, capturer) certaines informations, à un certain degré de granularité,… plutôt que d’autres.

Une construction

Or cette construction répond à des logiques sociales. La statistik allemande naît et s’institutionnalise au 17e siècle et s’adosse à l’Etat, staat, dont elle devient à la fois un outil de mesure et de pouvoir. De mesure, en ce qu’elle permettait de mettre la lumière sur les inégalités notamment, l’accroissement de la population, les migrations internes,… De pouvoir en ce que la définition des cadres cognitifs et de définition du réel par un indicateur préempte les options ouvertes (dans quelques années nous verrons probablement dans les formulaires administratif les cases Masculin/Féminin/Autre). Alain Desrosières, sociologue, statisticien et historien, explique en 1993 dans La Politique des Grands Nombres que le tournant néolibéral a renforcé cette tendance de la statistique à être un instrument de pouvoir en instaurant une culture du chiffre omniprésente : palmarès d’universités, palmarès des hôpitaux, mesure des temps d’embouteillage selon les villes… or ces chiffres portent en eux en plus d’une définition particulière de la réalité, une notion de concurrence, de course à l’efficacité.

Dans la langue gestionnaire, qui est celle de nos gouvernants actuels, l’efficacité renvoie à une idée : une allocation de ressources peut être optimale, c’est-à-dire la meilleure possible relativement aux conditions qui définissent un «état du monde» et à l’«information» disponible sur cet état. Être efficace se réduit alors à fonder ses décisions sur les chiffres produits par un dispositif de quantification qui en certifie l’objectivité; et à fixer des objectifs chiffrés et des indicateurs de performance permettant aux managers de service public de faire correspondre les coûts avec les prévisions budgétaires. C’est ainsi qu’une «obligation de résultat» s’impose, au nom de laquelle on s’habitue à faire fi de toute appréciation morale ou sociale quant aux décisions qui sont prises pour respecter le «plan». Plus ce raisonnement gestionnaire étend son emprise, plus la quête de l’efficacité efface le sens de l’action politique et vire à l’idéologie. Albert Ogien

Les statistiques ne sont donc, chez Alain Desrosières, pas seulement un ensemble de techniques de quantification, mais découlent, comme leur nom l’indique de l’Etat et de la façon dont sont pensés son rôle et son mode d’intervention sur la société. Elles sont donc à la fois “outils de preuve” et “outils de gouvernement”. Il se rapproche là du concept de Foucault de gouvernementalité soit un certain type de contrôle de l’État sur les populations, un certain mode d’exercice du pouvoir où gouverner c’est “exercer par rapport aux habitants, aux richesses, aux comportements de tous et de chacun, une forme de surveillance, de contrôle tout aussi attentive que celle du père de famille sur la maison et sur les biens” explique Véronique Dimier.

Données lacunaires et définition du vrai

Dès lors que la donnée est issue d’un environnement socio-culturel particulier et qu’elle procède à une certaine écriture de la réalité, la distanciation vis-à-vis de cette source d’information est nécessaire. C’est toute l’ambivalence du fact-checking comme nouveau mode de journalisme. D’une part parce que la charte de déontologie du journalisme tient explicitement “la non vérification des faits, pour (une des) plus graves dérives professionnelles”. D’autre part parce que cette tendance reste globalement aveugle sur les limites de son travail dans la chasse aux fake news.

La frénésie du fact-checking est elle-même le produit dérivé tardif, mais au plus haut point représentatif, du journalisme post-politique, qui règne en fait depuis très longtemps, et dans lequel il n’y a plus rien à discuter, hormis des vérités factuelles. La philosophie spontanée du fact-checking, c’est que le monde n’est qu’une collection de faits et que, non seulement, comme la terre, les faits ne mentent pas, mais qu’ils épuisent tout ce qu’il y a à dire du monde.Frédéric Lordon
Sondage Ifop-Fiducial diffusé mardi 10 avril

Plus généralement, la forme mathématique et la très relative neutralité de la donnée donnent l’illusion d’une objectivité. Pourtant, on peut s’interroger sur l’objectivité revendiquée de ces mesures.

“Les faits correctement établis ne seront jamais le terminus de la politique mais à peine son commencement, car des faits n’ont jamais rien dit d’eux mêmes, rien ! Des faits ne sont mis en ordre que par le travail de médiations qui ne leur appartiennent pas. Ils ne font sens que saisi du dehors par des croyances, des idées, des schèmes interprétatifs, bref, quand il s’agit de politique, de l’idéologie” Frédéric Lordon

On peut par ailleurs s’interroger sur la constitution même de ces données qui mesurent annuellement le sentiment d’insécurité, le nombre de vols avec violence, ou le nombre de voitures brulées le fameux soir de la Saint Silvestre, mais qui n’ont jamais recensées ni le nombre d’utilisation par la police de la force armée, ni le nombre de victime des interventions policières par exemple. En “oubliant” ces mesures, on condamne ces faits à l’inexistence et à l’impossibilité de certification ou d’objectivation.

Re-socialiser les données

Il ne s’agit pour autant pas de délégitimer les données comme sources d’informations. Mais plutôt que d’imaginer une rubrique composée de statisticiens ou de développeurs, il est nécessaire de s’interroger sur les soubassements de ce matériau nouveau et donc sur les modes d’interaction avec lui. Ce travail est réalisé par les scientifiques. Ceux-là s’interrogent sur le passage d’une science hypothético-déductive à une logique inductive (de reconnaissance de patterns), sur la fin des théories prophétisée par Chris Anderson, sur la représentativité des données par rapport à la relativement fondée méthode de l’échantillonnage, sur la perte de contrôle sur les sources (dont la certification est aujourd’hui problématique),… ces questions sont essentielles et le champ journalistique ne pourra en faire l’économie sans risquer de s’ériger en grand Mamamouchi délivrant des gommettes rouges ou vertes. Dans un article dédié à l’analyse des mutations impliquées dans les sciences sociales par la multiplication des données numériques, Etienne Ollion et Julien Boelaert pointent par ailleurs l’inadaptation des données massivement créées à des fins commerciales et marketing dans le cas des études de sciences sociales, Alan Ouakrat et Julien Mésangeau plaident eux pour une re-socialisation des données numériques afin de leur donner l’épaisseur sociale permettant de saisir la dimension collective des comportements des agents sociaux.

Écriture exploratoire ou gardiennage ?

Les données massivement accessibles aujourd’hui sont principalement issues de captures à des fins commerciales et ne permettent pas une compréhension fine des phénomènes sociaux, elles autorisent une connaissance des comportements individuels mais ne les expliquent pas. Aussi est-il nécessaire pour le journalisme d’en interroger les fondements et de distancier la mesure d’une activité et celle d’un phénomène (les plaintes de femmes battues ne représentent pas les nombre effectif de femmes battues).

D’autre part la culture du chiffre transforme ces mesures en objectifs, l’économiste Charles Goodhart expliquait dès 1975 que dès lors qu’une mesure devient un objectif, elle cesse d’être une bonne mesure puisqu’il ne s’agit plus de comprendre la réalité mais bien de la construire en adéquation à une visée politique. Et Dominique Cardon met en garde contre la perspective d’une gouvernance algorithmique qui ne serait que l’extrapolation de cette tendance et qui reviendrait selon lui à ce que le probable préempte le possible dès lors que ces algorithmes postulent de nos comportements en fonction de notre passé faisant fi du fait que “nous ne sommes pas la somme imprécise et incomplète de nos comportements”. Le journalisme de données n’est donc pas seulement l’importation dans le champ journalistique d’une culture statistique et informatique, mais bien aussi l’interrogation sur les outils et sources utilisés.

En 2006, Adrian Holovaty, le créateur du framework Django, écrivait un article plaidant pour un changement radical dans les rédactions et poussant celles-ci à sortir d’une vision “story-centric” pour entrer dans une logique d’information structurée. Il s’agirait donc pour les médias de créer leurs données. De construire des bases de données à partir de leurs observations de la réalité. Cette logique, qui affranchirait le data journalisme d’une dépendance à des sources officielles dans l’enregistrement de la réalité, serait une manière d’assumer le rôle de quatrième pouvoir qu’il revendique ?

En 2014, une équipe de datajournalistes coordonnée par le réseau Journalism++ a créé une base de données recensant les morts en Méditerranée, la première disponible, et mis en lumière la situation dramatique de cette “frontière” européenne. Après l’élection d’Emmanuel Macron à la présidence de la république, l’agence WeDoData a décidé d’enregistrer l’activité politique le temps de son mandat et commence à en publier des résultats sur le site Les Jours.Si la donnée représente une formidable opportunité de compréhension et de mesure du monde, sa constitution doit être interrogée afin de garder une distance réflexive suffisante et de ne jamais tomber dans l’illusion d’une objectivité qui ne serait que le gardiennage d’un cadre établi et le renoncement à agir effectivement sur le monde en utilisant les mesures, et donc cadres réflexifs d’acteurs politiques et économiques ayant leurs agendas propres.


Références

  • Bougnoux Daniel, « Si j’étais médiologue… », Les cahiers de médiologie, 1998/2 (N° 6), p. 61–71. DOI : 10.3917/cdm.006.0061. URL
  • Dominique Cardon, À quoi rêvent les algorithmes. Nos vies à l’heure des big data, Paris, Seuil, La République des idées, 2015, 105 p., ISBN : 978–2–02–127996–2
  • Carmes Maryse, Noyer Jean-Max, « L’irrésistible montée de l’algorithmique. Méthodes et concepts en SHS », Les Cahiers du numérique, 2014/4 (Vol. 10), p. 63–102. DOI : 10.3166/LCN.10.4.63‐102. URL
  • Citton Yves, Médiarchie, Paris, Editions du Seuil, 2017
  • Desrosières Alain, La politique des grands nombres. Histoire de la raison statistique. La Découverte, « Poche/Sciences humaines et sociales », 2010, 462 pages. ISBN : 9782707165046. URL
  • Dimier Véronique, État et gouvernementabilité en Afrique, BESPO — Université Libre de Bruxelles, Avril 2010
  • Lordon Frédéric, Politique post-vérité ou journalisme post-politique, La pompe à phynance, Monde Diplomatique 22 novembre 2016, URL
  • Ogien Albert, Tribune dans Libération : “L’efficacité n’est pas un programme politique”, publiée le 3.10.2017
  • Ollion Étienne, Boelaert Julien, « Au delà des big data. Les sciences sociales et la multiplication des données numériques », Sociologie, 2015/3 (Vol. 6), p. 295–310. URL
  • Ouakrat Alan, Mésangeau Julien, « Resocialiser les traces d’activités numériques : une proposition qualitative pour les SIC », Revue française des sciences de l’information et de la communication [Online], 8 | 2016, Online since 21 March 2016, connection on 20 April 2018. URL
  • Venturini Tommaso, Latour Bruno, Le tissu social/ the social fabric, traces numériques et méthodes quali-quantitatives, Sciences-Po Medialab, URL