WeDoData+IA #3 // des Dataviz au GIF, avec Code Interpreter

Wedodata
Wedodata
Published in
4 min readOct 4, 2023

Au sein de WeDoData, nous testons une myriade d’outils d’IA afin d’en évaluer l’impact sur nos métiers et trouver comment les intégrer intelligemment dans nos process de travail.

Ainsi, nous avons régulièrement besoin de créer des animations de graphiques interactifs pour montrer, notamment sur les réseaux sociaux, comment la dataviz fonctionne ou ce qu’elle offre comme information chiffrée.

Voici comment Code interpreter va réaliser une animation en GIF via nos consignes, en partant directement de la base de données.

1️⃣ Le choix du sujet : l’évolution des émissions de CO2 dans le monde

Nous optons pour les données d’évolution des émissions annuelles de CO2 par région du monde, de 1850 à 2019, proposées par le World Inequality Report (si vous souhaitez refaire l’exercice sur ces mêmes données, elles peuvent être téléchargées dans la page Methodology).

2️⃣ Le choix du graphique… avec ChatGPT comme conseiller

Nous avons téléchargé le fichier grâce au plugin Code Interpreter et lui avons décrit les données. Petite alerte : votre fichier sera en mémoire tampon moins d’une heure, donc ne pas traîner dans vos interactions.

Voici la première instruction que nous avons passé à ChatGPT4 :

WDD : Voici un fichier de données sur les Émissions annuelles mondiales de CO2 par région du monde, de 1850–2019 (milliards de tonnes de CO2). Illsutration avec la capture d’écran de la base.

Puis nous lui demandons de nous proposer le meilleur graphique au regard de ce jeu de données. Comme il fonctionne sur des librairies Python, ses propositions restent dans le périmètre de graphiques classiques.

WDD : Quels sont les graphiques les plus pertinents pour ces données ?

Réponse de ChatGPT :

Lorsqu’il s’agit de visualiser des données sur les émissions de CO2 par région sur une longue période, plusieurs types de graphiques peuvent être pertinents. Le choix dépend de l’information que vous souhaitez mettre en évidence. Voici quelques options: Graphique à Barres,  Graphique en Lignes ou Area Chart, Graphique Empilé ou Stacked Area Chart, Graphique Circulaire ou Pie Chart, Heatmap, Graphique en Pointes ou Dot Plot, Graphique en Boîte ou Box Plot

Par notre expérience, nous faisons assez vite le tri parmi toutes ces propositions. Typiquement, le Box Plot, le Dot Plot ou le Pie Chart ne permettent pas de montrer l’évolution des données, avec l’accélération des émissions en Chine, Amérique du Nord et Europe.

Box Plot / Dot Plot / Pie Chart : des options laissées de côté

Nous décidons donc de tester Code Interpreter sur deux graphiques : la HeatMap et le Area Chart. Et nous le guidons pour obtenir la visualisation la plus juste par rapport à l’information-clé de ce jeu de données :

WDD : Crée un heatmap

Réponse :

image de la heatmap demandée, avec des nuances de jaune, vert et bleu
WDD : Change la couleur bleu par la couleur rouge et précise la légende “milliards de tonnes de CO2”

Réponse :

la même heatmap, avec des couleurs jaune, orange et rouge
WDD : Fait maintenant un stacked AreaChart
Un stacked area avec les données, couleurs vertes
WDD : • Change les couleurs • Met la légende à droite du graphique et faire apparaître les pays de la légende dans l’ordre du graphique, supprimer la bordure de la légende et augmenter la hauteur du bloc légende. • Fais commencer l’année 1850 au croisement de l’axe des ordonnées et la dernière année de l’axe des abscisses en 2020.

Réponse :

Le même stacked area avec des couleurs différentes pour chaque donnée.

3️⃣ La création du GIF : la dernière touche d’animation

Sur les conseils de nos graphistes, nous avons estimé la vitesse idéale pour cette animation était autour de 4 images par seconde (fps)de manière à rester lisible mais rapide.

WDD: Faire un gif à partir de ce graphique qui montre l’évolution des données tous les 10 ans. Les axes des ordonnées et des abscisses sont fixes. Avoir une vitesse de 4fps

Réponse :

Une animation GIF du graphique stacked area affichant la courbe peu à peu
L’animation finale

4️⃣ Notre conclusion

Si ChatGPT est un outil d’accélération des process de travail, il n’offre une entière satisfaction que si vous avez les compétences métier pour le guider dans la bonne direction.

Ici, toutes les spécifications que nous avons fournies à ChatGPT sont des expertises spécifiques à la datavisualisation.

Nous changeons de rôle : nous n’exécutons plus (ou presque), nous décrivons l’exécution.

Avec cette IA générative, on se dirige vers une logique de « texte vers tout », où les requêtes textuelles peuvent générer n’importe quel format de sortie.

--

--

Wedodata
Wedodata

Studio de datajournalisme et datavisualisations : trouver et raconter des histoires en partant de bases de données structurées ou à créer / wedodata.fr