Covid et Data #2 : et si on faisait une comète…

Brice Terdjman
Wedodata
Published in
4 min readMay 4, 2020

Depuis le début de cette épidémie, les graphiques ont envahi les écrans. Face à cette profusion, chez Wedodata, on a souhaité prendre du recul, réfléchir à l’impact de ces visualisations sur des sujets de santé publique, tester des formats. On a décidé de vous faire partager les coulisses de ces recherches. Episode#2

Il arrive bien souvent qu’en triturant les données et en multipliant les essais graphiques, on tombe sur une représentation qui nous satisfasse. C’est l’histoire de ce graphique original entre « feu d’artifice » et « comète » : après quelques hésitations, on a décidé de l’appeler le “diagramme comète”. Comment en sommes-nous arrivés là ?

Valeur instantanée + cumulée = ?

Tout est parti de l’envie de représenter simultanément deux dimensions des données du Covid-19 : la mortalité cumulée et la mortalité quotidienne.

Nous sommes donc partis des données de la page github de l’Université John Hopkins (données du 3 mai 2020) : un bilan quotidien du cumul des victimes par pays (parfois par province, dans le cas de la Chine, ou par région). Après nettoyage et enrichissement des bases (correspondance des noms de pays en français, calcul de la date à laquelle le pays compte plus de 10 morts, etc.), nous avons téléchargé les données dans Tableau, un outil que nous utilisons régulièrement pour tester des rendus visuels.

Les graphiques à deux axes ne conviennent pas, trop de pays qui rendent le résultat incompréhensible. La courbe est une bonne option : la trajectoire sera le nombre de décès cumulé, l’épaisseur de la courbe le nombre de décès quotidien.

Cette première visualisation a le mérite de faire ressortir les pays les plus touchés (Etats-Unis, France, Italie, Espagne…). Nous voyons également que certains pays ont une courbe peu épaisse et plate (celle de la Chine, si l’on en croit les données fournies). La France montre des irrégularités, c’est le reflet des journées où les données des Ehpad ont été ajoutées en bloc. Les États-Unis, malheureusement, se distinguent par la pente et l’épaisseur de leur trajectoire.

Logarithme : l’art de tasser/redresser les courbes

Justement, l’ampleur du désastre sanitaire américain “écrase” le reste des pays. Comme nombre d’autres traitements graphiques (notamment le Coronavirus Tracker du Financial Times), nous optons pour une représentation logarithmique du nombre de décès.

Ce procédé a 2 avantages dans notre situation :

  • Les courbes sont plus ramassées, les pays moins touchés sont plus visibles
  • Les courbes traduisent alors le rythme des décès puisqu’à chaque graduation de l’axe vertical, le nombre de morts est doublé

Nous voyons désormais que la Chine a atteint son plateau aux alentours du 27 février dernier. Plusieurs pays, comme l’Iran, la Chine ou le Brésil, ont une épaisseur de courbe relativement faible par rapport aux pays européens plus gravement touchés. Nous découvrons enfin un faisceau de pays, cachés dans le précédent graphique, que nous avons préféré passer en gris pour mettre l’emphase sur les pays les plus sévèrement atteints.

Les inflexions sont aussi accentuées : l’Italie et l’Espagne ont bien entamé leurs décrues contrairement aux États-Unis dont le rythme peine à ralentir.

Dernier effet (inattendu), le traitement logarithmique a “redressé” les débuts de courbes, on distingue maintenant nettement le démarrage pour chaque pays, contrairement au premier graphique où les pentes faibles rendaient le début des courbes indistinctes.

Mais le décalage dans le temps des courbes rend plus compliqué la comparaison des rythmes, chose que nous avons cherché à corriger dans le dernier essai ci-dessous.

Quand l’animation ajoute de l’information

Ici, nous avons commencé par “aligner” tous les pays en prenant un même point de départ, le jour où 10 décès sont comptabilisés dans le pays : l’axe horizontal n’est donc plus la date calendaire, mais un nombre de jours écoulés depuis ce 10e décès. L’intérêt de ce traitement consiste à faire partir chaque courbe du même “endroit” et ainsi, faciliter la comparaison des pentes. L’alignement des courbes limite cependant la lecture des labels de pays, il ne nous sera pas possible d’améliorer facilement la lisibilité sur Tableau : nous atteignons les limites de l’outil.

Mais nous ne souhaitions pas pour autant perdre la notion calendaire : nous l’avons réintégré en rajoutant l’animation temporelle au graphique. La Chine commence alors son ascension en février, rejointe début mars par l’Iran, l’Italie et la Corée du Sud… Puis le reste du monde.

Si vous souhaitez reprendre ces graphiques pour une publication ou si vous souhaitez une mise à jour des données, merci de nous écrire sur hello@wedodata.fr

N’hésitez pas à réagir/commenter/proposer des pistes via Twitter ou par mail.

Pour retrouver l’épisode 1, c’est ici : Et si on déformait la France…

--

--

Brice Terdjman
Wedodata

datadesigner @We_do_data #data #visualization #datajournalism