Comment choisir une dataviz percutante ?

Anne-Claude TREGOUËT
BeTomorrow
Published in
7 min readSep 20, 2018

Illustrer votre étude avec des graphiques, c’est bien. Mais rendre votre étude marquante grâce à une visualisation de données percutante, c’est mieux ! Comment se démarquer, et comment mettre en place une visualisation qui impactera tout de suite votre lecteur ? Cet article va répondre à vos questions…

Les (bonnes) questions à se poser

“Alors, les données sont triées par groupe, donc il faudrait un camembert… Ah, non, elle sont aussi temporelles, donc il faudrait plutôt un graphique linéaire avec plusieurs courbes ?”

On oublie toutes ces questions ! Avant même de penser au type de graphique, il vaut mieux prendre du recul sur le rapport que l’on est en train de préparer, et se poser les vraies bonnes questions :

  • Qu’est-ce que mes données racontent ?
  • Qu’est-ce que je veux mettre en valeur ? Qu’est-ce que moi, je veux raconter ?
  • Qui est le destinataire de mon étude ?

Qu’est-ce que mes données racontent ?

La première chose évidente à faire est d’identifier les messages se dégageant de votre jeu de données. En analysant les données, vous avez sûrement trouvé plein de choses pertinentes à dire. Mais si un jeu de données peut raconter beaucoup de choses, il est cependant illusoire de penser pouvoir tout représenter dans un seul graphique…

Qu’est-ce que je veux mettre en valeur ? Qu’est-ce que moi, je veux raconter ?

C’est LA question clef ! Si vous ne savez pas ce que vous voulez raconter, vous serez incapable de le laisser transparaître dans votre rapport. Il va donc falloir choisir ce que vous voulez montrer. En général, une visualisation de données délivre un seul message, il faut donc choisir ce message avec soin.

Voici quelques exemples (non exhaustifs) :

  • Je veux montrer une évolution
  • Je veux montrer l’importance ou l’intensité d’une variable
  • Je veux montrer une répartition
  • Je veux me situer par rapport à un objectif
  • Je veux comparer
  • Je veux montrer une hiérarchie ou une arborescence
  • Je veux montrer une explication géographique
  • Je veux montrer une corrélation entre deux variables
  • Je veux mettre en évidence des groupes
  • Je veux montrer des relations entre des ensembles
  • Je veux montrer le cheminement de ma pensée
  • etc…

Qui est le destinataire de mon étude ?

Enfin, on ne le répétera jamais assez : mettez-vous à la place du destinataire ! Est-il déjà familier du sujet ? Ou au contraire en est-il éloigné ? Cherche-t-il à prendre des décisions ? A se tenir au courant du bon déroulé d’un projet ? A faire de la communication ? De quelle génération est-il ? Passer du temps à répondre à ces questions ne sera jamais du temps perdu.

De plus, n’hésitez pas à faire relire votre rapport par des personnes extérieures. Elles seules vous permettront de prendre le recul nécessaire sur votre travail, et de vous re-situer par rapport à votre destinataire final.

Les types de graphique qui servent votre message

Une fois que vous cernez exactement le message que vous voulez faire passer, vous pouvez choisir le graphique le plus adéquat.

Dans cet article, j’ai fait le choix de ne pas décrire chaque type de graphique un par un. Internet fourmille déjà d’articles sur le sujet, vous en trouverez assez facilement.

Cependant, vous trouverez ci-dessous les graphiques les plus communément utilisés pour chaque type de message à faire passer :

“Je veux montrer une évolution”

“Je veux montrer l’importance ou l’intensité d’une variable”

“Je veux montrer une répartition”

“Je veux me situer par rapport à un objectif”

“Je veux comparer”

“Je veux montrer une hiérarchie ou une arborescence”

“Je veux montrer une explication géographique”

“Je veux montrer une corrélation entre deux variables”

“Je veux mettre en évidence des groupes”

“Je veux montrer des relations entre des ensembles”

“Je veux montrer le cheminement de ma pensée”

Autres

Il existe bien d’autres représentations graphiques, et il est aussi possible de combiner différents types de graphiques entre eux. N’hésitez pas à être créatif et à sortir des sentiers battus. Mais surtout, gardez en tête le message à faire passer.

Quelques pièges à éviter

Lors de la réalisation d’études, on rencontre souvent les mêmes problématiques de visualisation, dont certaines sont décrites ci-dessous…

Représenter beaucoup d’éléments

L’exemple ci-dessus parle de lui-même! Ne cherchez pas à représenter trop de catégories dans un graphique en camembert, sauf si votre message est “Je veux montrer qu’il y a énormément de catégories”. Dans ce cas là, il ne sert à rien d’afficher une légende complète, puisque votre destinataire aura de toute façon compris votre message.

En général, et selon les écoles, il est préconisé d’utiliser le graphique en camembert pour 3 à 6 catégories maximum. Au delà, il est plus pertinent d’utiliser un histogramme. Ou alors, pensez à la possibilité de regrouper toutes les catégories faiblement représentées en une nouvelle catégorie appelée “Autres”, afin de ne laisser apparaitre que le top 5. En tout cas, le plus important est de vous recentrer sur votre message, et de vous mettre à la place de celui qui regardera ce graphique.

Pour représenter beaucoup de catégories, il est plus pertinent d’utiliser un histogramme (à gauche), ou de créer une nouvelle catégorie “Autres” dans un graphique en camembert (à droite), regroupant les catégories peu représentatives.

Jouer avec les valeurs min/max des axes des graphiques

Le choix des valeurs minimum et maximum sur les axes d’un graphique sont importants. Voyons cela avec les 3 exemples suivants, qui proposent à chaque fois deux représentations graphiques différentes pour les mêmes données :

1) Le graphique de gauche laisse penser que la France se retrouve très éloignée de la Roumanie… alors que celui de droite montre que les deux pays ne semblent pas si éloignés que cela. Cela est dû au choix de la valeur minimum de l’axe des abscisses, qui commence à 36 sur le graphique de gauche, et à 0 sur celui de droite. (source image : https://callingbullshit.org/)
2) Le graphique de gauche montre de fortes perturbations puis une forte augmentation de la température… alors que celui de droite laisse penser qu’il n’y a eu aucune variation significative. Cela est dû au choix de la valeur minimum de l’axe des ordonnées, qui commence à 56 sur le graphique de gauche, et à -10 sur celui de droite (source image : https://callingbullshit.org/)
3) Le graphique de gauche laisse penser que la plupart des éléments de l’ensemble sont représentés par la première catégorie… alors que celui de droite montre que cette catégorie représente moins du quart de l’ensemble. Cela est dû au choix de la valeur maximum de l’axe des ordonnées, qui atteint 25% sur le graphique de gauche, et 100% sur celui de droite.

Avec ces trois exemple, on réalise que changer les valeurs minimum et/ou maximum des graphiques permet d’amplifier l’impact sur le lecteur, voire d’en biaiser son interprétation.

Ces changements d’échelle sont donc à manier avec précaution. Parfois, le contexte de l’étude l’impose (par exemple, une petite variation de température est significative et peut justifier une modification de l’échelle). Mais dans la plupart des cas, cela se rapproche de la manipulation et, à terme, vous desservira.

Les couleurs

Le type de graphique seul ne contribue pas à avoir un effet percutant. Les couleurs font aussi partie du message, et il faut se rendre compte que leur choix n’est pas anodin.

Par exemple, certaines couleurs sont connotées. Ainsi, la couleur verte sera toujours considérée positivement (“l’objectif est atteint”), la couleur jaune ou orange rendra compte d’un état intermédiaire (“l’objectif est en voie d’être atteint”), et le rouge sera connoté négativement (“on est très éloigné de l’objectif”).

L’intensité d’une couleur peut également traduire une notion de densité : plus une couleur est foncée, plus le lecteur perçoit une forte densité.

Enfin, pensez que votre rapport peut être consulté par des personnes daltoniennes. Ces dernières ne distinguant pas certaines couleurs entre elles, cela vous amènera peut-être à redéfinir les couleurs de votre rapport.

Pour conclure

Une visualisation de données raconte une histoire. Des choix relativement subtils, comme celui du choix du type de graphique, des couleurs, de la plage utilisée pour les axes, peuvent avoir un gros impact sur l’histoire racontée par votre visualisation.

Lorsque vous créez un graphique, il faut donc se rendre compte que ce dernier peut être conçu soit pour raconter une histoire qui reflète fidèlement les données sous-jacentes, …soit pour raconter la propre histoire qui vous intéresse. Certaines astuces sont importantes afin d’aider l’utilisateur à comprendre votre message. Attention cependant à ne pas tomber dans le côté obscur de la manipulation… tout en restant attentif à ne pas vous faire manipuler vous-même!

Remarque : je n’ai pas abordé le cas où votre objectif est de rechercher le message pertinent de votre jeu de données. Dans ce cas, le but n’est pas encore d’être percutant, mais de rechercher d’abord la vérité. La visualisation de données sera alors le moyen de vous aider à comprendre les données, ou sera le support permettant le dialogue entre différents interlocuteurs.

Si vous avez des remarques ou des expériences sur ce sujet, je vous invite à les partager dans un commentaire.

BeTomorrow est une agence de conseil, design et développement. Pour aller plus loin, nous vous invitons à lire nos derniers articles ou nous contacter directement.

Sources : la plupart des représentations graphiques sont issues de la Google Chart Gallery.

--

--

Anne-Claude TREGOUËT
BeTomorrow

Data scientist chez Pôle emploi. Data / Analytics / Décisionnel / Mobile