Comment utiliser le journalisme de données pour trouver des idées de contenu

À proprement parler, le journalisme de données s’attache à raconter des histoires avec des chiffres.

Nous allons cependant étendre cette définition, puisque les données utilisables pour raconter une histoire peuvent prendre plusieurs formes,
comme de simples faits (historiques, biographiques, géographiques), mais aussi différents supports média (entretiens, galeries photos, extraits vidéos).
L’idée ici est de vous donner un large aperçu de ce qu’est le journalisme de données et comment vous pouvez l’utiliser pour trouver des idées de contenu.

Identifier les données

La première étape consiste à identifier les données que vous pouvez utiliser. Mais avant cela, vous devez définir vos besoins.

Quel est le sujet que vous désirez couvrir ? Est-ce qu’il s’agit d’une tendance saisonnière (semaine de la mode, première d’un film), ou bien un contenu froid qui ne change pas avec le temps (élevage de chiens, recettes) ?

Si des données relatives à un contenu froid sont faciles à trouver en ligne et constituent un contenu de longue traîne intéressant, celles concernant les contenus plus chauds sont plus difficiles à obtenir.
Vous devez rester au fait de tout nouvel événement dans votre domaine, et être aussi réactif que possible face à vos compétiteurs qui veulent parler du même sujet au même moment.

Une fois identifié le type de données que vous recherchez, vous devez encore mettre la main dessus.

Les données ouvertes permettent d’obtenir des informations gratuites recueillies par des organismes gouvernementaux. Data Catalogs est un bon point de départ pour votre recherche. Ce site propose des sources de données ouvertes pour un certain nombre de pays.

Par exemple, imaginons que vous vous intéressiez aux centres de santé parisiens. Vous pouvez obtenir la liste des centres de consultation par spécialité.
De la même façon, vous avez accès à la liste des parkings bordelais et à leurs tarifs.

Ces catalogues de données ouvertes sont une bonne source si vous cherchez des données spécifiques. Vous pouvez aussi les parcourir et y trouver de nouvelles idées de contenu.

Lorsque vous les parcourez, il est important de garder l’esprit ouvert : vous pouvez mettre à jour des données sans relation aucune avec votre recherche initiale et découvrir un nouvel angle pour aborder votre contenu.

Par exemple, feuilleter les données de la Sécurité Sociale des États-Unis peut être source d’idées comme l’incidence des films et des séries télévisées sur les prénoms donnés aux enfants.
Vous pouvez corréler ces données avec les sorties des films ou les événements sportifs de l’actualité pour y apporter une certaine profondeur.

Le visualiseur n-gram de Google Livres est un outil qui permet de visualiser les mots apparaissant dans des ouvrages couvrant une certaine période dans une langue donnée.

Par exemple, le graphique suivant montre la présence de quatre noms de personnages du Seigneur des Anneaux dans la littérature (à savoir Arwen, Eowyn, Galadriel et Isildur), avec un premier pic en 1979 et un second entre 2004 et 2005.

Si vous cherchez du contenu chaud, deux sources en particulier peuvent vous aider à identifier les tendances dans un pays ou une langue spécifique en ce moment même ou bien à une date particulière. Il s’agit des statistiques de trafic Wikipédia par page et de Google Trends.

Chacun de ces sites peut vous aider à identifier un motif dans les termes recherchés.

Par exemple, l’élevage de chiens est principalement recherché le dimanche aux États-Unis, tandis que la page correspondante sur Wikipédia en anglais est principalement vue le mardi. Bon, je ne peux pas en tirer grand-chose, mais si votre contenu concerne les chiens, il est possible que vous le pouviez. Au moins, vous savez quand publier votre contenu et le promouvoir sur les médias sociaux pour obtenir le plus d’impact.

Google Trends va un peu plus loin, puisqu’il associe les raisons du pic d’intérêt avec des actualités spécifiques, tout en donnant des résultats jusqu’à l’échelle de la ville, ce qui est une bonne manière de récolter de l’information à l’échelle locale.

Par exemple, les recherche contenant les termes « semaine de la mode » ont atteint leur apogée en mars et septembre 2015 pour la France (pour la semaine de la mode de Paris puis celle de New York), alors que les Australiens s’intéressent plus à celle de Shanghai en avril.

Selon votre audience, vous savez quand vous préparer pour un contenu chaud suffisamment en avance. Une bonne règle à garder en tête est que le public est généralement plus intéressé par des nouvelles locales en premier lieu.

Transformer vos idées en histoires

Qui, quoi, quand et où demeurent en journalisme de données les principales questions auxquelles il faut répondre. Le datajournalisme n’est en cela pas différent du journalisme classique. Le pourquoi est plus difficile à rendre, puisqu’il nécessite une véritable analyse difficile à exprimer par des éléments visuels. Le pourquoi a besoin de plus d’espace et de plus de mots pour être expliqué en détail.

Pour transformer de la donnée brute en une bonne histoire, il vous faut trouver le bon angle, ce qui signifie que vous devez réfléchir à la question à laquelle vous allez répondre.

Trouver un récit apporte aussi de la vie aux faits et aux données que vous avez réunis.

Un bon point de départ est d’identifier quelle donnée particulière ne cadre pas avec le reste : la valeur aberrante. En statistiques, une valeur aberrante est un point distant des autres observations. Dans le cas des centres de santé parisiens, il peut s’agir d’un arrondissement qui concentre beaucoup plus de centres que les autres, ou inversement celui qui correspond à un véritable désert médical. En résumé, tout ce qui s’éloigne du schéma global peut vous donner un angle.

Mais si une valeur aberrante peut faire une bonne histoire, elle peut aussi être le signe d’une erreur dans les données, mieux vaut particulièrement soigner sa vérification.

La plupart du temps, les données récoltées peuvent soulever plusieurs questions. S’il peut être utile de proposer plusieurs façons d’interagir avec vos données à vos utilisateurs, par exemple en leur donnant à la fois une carte et un graphique, cela peut aussi être une bonne opportunité de créer différents contenus à partir des mêmes données.

Une histoire que je qualifierais de panoramique peut apporter une vision globale sur un sujet. Cette vue large peut être illustrée par des vues spécifiques à votre public (à la fois géographiquement et en terme de granularité du sujet), résultant de ce fait en un nombre de contenus plus importants.

À titre d’exemple, voyons la semaine de la mode. Elle peut être abordée sous différents points de vue :

  • une carte des prochaines semaines de la mode avec recherche à facettes (haute couture/prêt-à-porter, maisons, collections, designers)
  • une comparaison des couleurs/motifs/matières entre différentes années pour la même semaine de la mode locale
  • une comparaison des couleurs/motifs/matières entre différentes semaines de la mode locales pour la même saison
  • une biographie des designers/maisons de haute couture, avec leurs œuvres respectives

Les témoignages sont aussi une bonne façon d’apporter de la vie à votre contenu. Dans l’article Boston Marathon Moment 4:09:43, le but était d’aller au-delà de l’attentat et de donner les points de vue des personnes présentes. Lors d’un événement aussi bouleversant, le nombre de blessés fait perdre la dimension humaine du drame et cet article a su délivrer l’émotion à son audience, notamment par les voix enregistrées des témoignages.

En mettant des visages et des voix sur les nombres, le public a pu ressentir un sentiment d’appartenance à l’histoire, sans voyeurisme ni sensationnalisme. Si cet exemple est particulièrement poignant, il faut garder à l’esprit que les données sont souvent perçues comme froides et distantes, et les témoignages permettent d’y apporter cette émotion qui manque.

De la même façon, pour expliquer l’affaire SwissLeaks, le journal Le Monde a dés-anonymisé la fraude fiscale en créant des personnages comme M. Dupond. Il permet aux visiteurs de s’identifier à un fraudeur et de mieux comprendre le rôle de chaque intervenant.

Source

Visualiser les données

Parfois, ce sont les visualisations les plus simples qui transmettent le mieux votre point de vue. De manière générale, vous devez vous retenir de placer la visualisation et l’interaction avant votre contenu, car c’est lui qui doit raconter une histoire.

Après ce préambule de précaution, voyons les différents types de visualisation groupés par le type de données que vous voulez montrer, chacun exprimant un sens particulier.

L’article A Tour Through the Visualization Zoo les groupe en cinq ensembles :

  • les données temporelles (temporalité) : graphe d’indices, histogramme empilé, petit multiple, graphique d’horizon
  • les distributions statistiques : diagramme à tiges et à feuilles, diagramme quantile-quantile, matrice de nuages de points, coordonnées parallèles
  • les cartes (géolocalisation) : carte des flux, carte choroplèthe, carte à symboles gradués, cartogramme
  • les hiérarchies : diagramme nœud-lien, dendrogramme, diagramme d’adjacence (en soleil, en stalactites), diagramme clos (treemap en carrés, groupes de cercles)
  • les réseaux (interconnexions) : disposition dirigée par la force, diagramme d’arcs, vues matricielles

Tandis que Christian Behrens les groupe en huit ensembles :

  • Corrélations : diagramme à bulles, nuage de points
  • Quantités continues : sparkline, diagramme en bâtons superposés, graphe en ligne muti-ensemble, graphe en ligne simples
  • Quantités discrètes : graphique de durée, graphique à barres isométrique, graphique à barres empilées, matrice de point, graphique à barres multi-ensemble, graphique à barres simple
  • Proportions : graphe en anneau, camembert
  • Flux : thread arcs, diagramme Sankey
  • Hiérarchies : diagramme arborescent, tree map
  • Réseaux : carte de diagramme, cercle de relation, collier de perles
  • Configurations spatiales : carte topographique, carte thématique

Pour choisir la meilleure représentation graphique, une autre approche consiste à penser à ce que vous désirez montrer : une comparaison (entre plusieurs éléments ou sur une période de temps), une relation ou une distribution (dépendant du nombre de variables), une composition (statique ou qui change avec le temps).

L’outil de suggestion de graphiques suivant a été conçu par Andrew Abela et est disponible sur son site Extreme Presentation.

Une fois choisi le meilleur type de visualisation pour exprimer votre message, vous devez encore l’implémenter. Il existe de nombreuses bibliothèques javascript pour ce faire, cet article de Thomas Greco en liste quelques-unes.

Si vous préférez rester aussi loin que possible du code, certains services peuvent vous aider à créer des visualisations à partir de vos données :

  • Datawrapper est utilisé par les éditions numériques de nombreux journaux. Ce projet open source est un outil pour le journalisme de données.
  • Tableau public est un outil gratuit pour créer des visualisations interactives et les publier sur le web.
  • Infogr.am est une application gratuite pour créer des infographies et des graphiques.
  • Story Maps combine des cartes interactives et du contenu multimédia, et fournit des applications intéressantes, comme SpyGlass ou le Map Journal pour créer des expériences utilisateur prédéfinies. Ce service se base sur la plateforme cartographique ArcGIS, qui offre un programme pour les utilisations non commerciales.

Sites d’inspiration

Si Snow Fall est l’un des contenus long format multimédia les plus partagés du monde, le New York Times continue de publier des contenus très intéressants en terme de visualisation de données, de graphiques explicatifs et de fonctionnalités interactives. Les productions les plus emblématiques sont compilées par année (2012, 2013, 2014).

The Guardian Interactive liste les dernières histoires interactives publiées sur son site, des articles multimédia en forme longue aux infographies interactives en passant par les vidéos.

Le site du Texas Tribune a une section consacrée dans laquelle les utilisateurs peuvent interagir avec les données. Même si ces données sont disponibles gratuitement ailleurs puisque provenant de sources publiques, cette section du site compte à elle seule pour 45% à 55% du trafic du site. Cela montre clairement que si vous proposez des données correspondant à votre public d’une façon engageante et signifiante, vos visiteurs reviendront pour les utiliser et les partager, un trafic à partir duquel vous pouvez facilement créer un effet de levier sur les réseaux sociaux.

Le Monde, journal français, présente lui-aussi ses meilleurs articles de visualisation de données, tout comme La Nación, journal argentin.

Comme vous pouvez le voir, de nombreux journaux essaient d’apporter un plus à leurs éditions numériques avec des visualisations de données interactives. Si les plus connus constituent une bonne source d’inspiration avec leurs grandes équipes dédiées aux données, vous pouvez aussi garder un œil sur les éditions moins connues, une petite équipe pouvant avoir des idées novatrices et inspirantes.

Pour creuser le sujet un peu plus en profondeur

Cet article est principalement centré sur la découverte d’idées de contenu à partir de sources de données pour nourrir vos processus d’idéation. Mais il s’agit d’un point de vue très réduit sur le journalisme de données. Si vous êtes intéressés par les multiples activités liées au journalisme de données, voici quelques liens pour aller plus loin :

  • Data driven journalism, une initiative du European Journalism Centre. En plus d’être un carrefour pour les actualités et les ressources sur le journalisme de données, ce site propose un MOOC intitulé « Journalism with Data: First Steps, Skills and Tools ». Ce cours est offert régulièrement. Une version française, « Comment devenir un bon datajournaliste », a déjà été mise en place par deux fois par Rue89.
  • Le Guide du datajournalisme est un ouvrage de référence gratuit proposé à la fois par le European Journalism Centre et la Open Knowledge Foundation. Il couvre le datajournalisme dans les salles de rédaction, des études de cas, ainsi que comment obtenir, comprendre et transmettre les données à votre public.
  • School of Data, soutenu par la Open Knowledge Foundation, propose de nombreux outils et articles sur l’extraction de données, leur nettoyage, leur analyse, leur présentation et leur partage.

En guise de conclusion

J’espère que vous avez à présent une idée de ce qu’est le journalisme de données, et particulièrement de comment il peut vous aider à trouver de nouvelles idées de contenu. Ce que vous devez retenir de cet article est d’utiliser différentes sources de données, mettre en relation des données diverses pour rafraîchir votre point de vue, vous exposer aux techniques de visualisation, et plus que tout être inspiré par ce que les autres font.

Cet article est un traduction adaptée par l’auteur au public français de l’article Using Data Journalism to Generate Content Ideas publié sur le site SitePoint avec leur aimable autorisation. Vous pouvez d’ailleurs aussi suivre leur blog sur Medium.

Si vous avez aimé cet article, merci de cliquer sur le bouton « Recommander » ci-dessous afin que d’autres puissent le découvrir.

Vous pouvez aussi me suivre sur Twitter ou faire appel à mes services de traduction et relecture.

Photo par Nicola Perantoni via Unsplash.