Covid et Data #5 : et si on dessinait une virgule…

Victor Schmitt
Wedodata
Published in
5 min readJun 3, 2020

Depuis le début de cette épidémie, les graphiques ont envahi les écrans. Face à cette profusion, chez Wedodata, on a souhaité prendre du recul, réfléchir à l’impact de ces visualisations sur des sujets de santé publique, tester des formats. On a décidé de vous faire partager les coulisses de ces recherches. Épisode#5

Le nombre de personnes en réanimation en France est, depuis le début de la pandémie, l’indicateur qui a mobilisé toute l’attention et toutes les craintes. La baisse de ces dernières semaines donne en effet de l’espoir aux personnels soignants et incarne le résultat tangible du confinement. C’est pourquoi nous nous sommes interrogés sur les différentes manières de représenter fidèlement cet indicateur spécifique.

Pour visualiser cette baisse, on pourrait d’abord utiliser une simple courbe, ce qui donnerait ceci (données arrêtées au 24 mai 2020).

Évolution du nombre de personnes en réanimation

Données hospitalières relatives à l’épidémie de COVID-19 (data.gouv.fr)

Il n’est toutefois pas aisé sans labels ou annotations supplémentaires de savoir à quels moments le nombre de malades a le plus progressé, atteint son pic ou commencé à fléchir.

Pour visualiser ces moments au niveau national, nous avons donc calculé la différence du nombre de personnes en réanimation par rapport à la veille. Nous avons ensuite disposé ces résultats sur des histogrammes, un pour chaque jour, et représenté les augmentations en bleu et les baisses en orange.

Évolution quotidienne du nombre de personnes en réanimation

Données hospitalières relatives à l’épidémie de COVID-19 (data.gouv.fr)

Avec ce graphique, il est facile de repérer le premier jour de baisse, situé le 9 avril avec une baisse de 82 personnes par rapport à la veille. On peut aussi repérer les jours où les baisses étaient les plus importantes : par exemple, l’histogramme du 15 avril représente la première forte baisse avec 268 personnes de moins en réanimation. On remarquera par ailleurs que les fortes baisses ont souvent lieu en milieu de semaine, le mardi ou le mercredi alors que les week-ends sont plus calmes.

On perd toutefois une information qui était parfaitement lisible sur la courbe : le nombre total de personnes actuellement en réanimation. Pour visualiser toutes ces dimensions dans un seul graphique, nous avons alors réalisé un graphique en cascade. Il permet de représenter à la fois le total et les évolutions quotidiennes.

Nombre de personnes en réanimation et évolution quotidienne

Données hospitalières relatives à l’épidémie de COVID-19 (data.gouv.fr)

Concrètement, lorsqu’un jour présente un chiffre en hausse, le pied de l’histogramme représente le total de la veille et la tête de l’histogramme représente le total du jour. A l’inverse, lorsqu’un jour présente un chiffre en baisse, la tête de l’histogramme représente le total de la veille et le pied de l’histogramme représente le total du jour.

Ainsi sur ce seul graphique, on peut visualiser pour chaque jour le nombre total de malades en réanimation et son évolution par rapport à la veille. L’ajout de la couleur permet de distinguer les hausses et les baisses facilement et de se concentrer sur la taille de ces évolutions journalières.

Un autre type de graphique visualisant l’ensemble de ces dimensions a été proposé sur Twitter par Elias Orphelin, étudiant en école de commerce : il s’agit d’histogrammes représentant le total de patients en réanimation colorés en fonction de l’évolution par rapport à la veille.

Capture d’écran du graphique d’Elias Orphelin diffusé sur son compte Twitter @eorphelin

Le résultat est convaincant mais nous semble plus difficile à interpréter qu’un graphique en cascade. Pourquoi ? C’est en se posant cette question que je me suis rappelé de cet article très intéressant paru en décembre dernier dans Knowable Magazine : « Why scientists need to be better at data visualization ». Cet article nous rappelle (entre autres précieux enseignements) que lorsque nous lisons un graphique, nous avons moins de difficultés à interpréter la longueur des formes (par exemple, la longueur des histogrammes) que la variance de leur couleur. Si c’est possible, il vaut donc mieux privilégier une échelle de taille à une échelle de couleur.

Classement des éléments visuels les plus efficaces. Produit par Knowable Magazine en décembre 2019.

En bonus, nous vous livrons une variante de ce graphique en cascade : dans une démarche purement esthétique, nous avons essayé de transposer les données des histogrammes en cascade sur un graphique en aire. Voici le résultat de notre tentative, qui a pris des allures de virgule.

La logique est la même que pour l’histogramme en cascade : pour les jours en hausse, le bas de l’aire représente le nombre total de patients de la veille tandis que le haut de l’aire représente le total du jour, et vice versa pour les jours en baisse.

Nombre de personnes en réanimation et évolution quotidienne (graphique en aire)

Données hospitalières relatives à l’épidémie de COVID-19 (data.gouv.fr)

Nous avons également imaginé une version interactive de ce graphique que vous pouvez tenter d’améliorer en vous plongeant dans le code. Il a en effet été généré grâce à la librairie Javascript D3 et est librement accessible sur Observable, le fameux notebook de Mike Bostock.

Si vous souhaitez reprendre ces graphiques pour une publication ou si vous souhaitez une mise à jour des données, merci de nous écrire sur hello@wedodata.fr

N’hésitez pas à réagir/commenter/proposer des pistes via Twitter ou par mail.

Pour retrouver :
- l’épisode 1 : Et si on déformait la France…

- l’épisode 2 : Et si on faisait une comète…

- l’épisode 3 : Et si on se plongeait dans les bases mondiales…

- l’épisode 4 : Et si on se concentrait sur les jours…

--

--