Behind The Numbers : Visualisation d’un

semi marathon


Visualiser des données n’est pas seulement mon métier, c’est aussi ma passion. Depuis longtemps déjà, quand je vois des données consolidées j’aime en savoir davantage, essayer de regarder derrière un fichier Excel ou une base de données.

Quand j’ai vu le classement du semi marathon de Porto Vecchio, j’ai tout de suite pensé à ce qui pouvait y avoir derrière. Quelle histoire ces données pouvaient-elles raconter ? Comment les rendre lisible au plus grand nombre et essayer de donner une nouvelle lecture de cet évènement ?

Un semi marathon c’est 21,1 kilomètres d’efforts, de souffrance et de plaisir où chacun essaye de donner son maximum pour faire le meilleur temps possible.

Le classement agrège donc ces efforts et propose un instantané de la forme de plusieurs centaines de personnes à un temps et un lieu donné.

Au delà des sensations, il y a les chiffres. Et une course n’en manque pas. Il suffit de parler avec n’importe quel coureur passionné, pour qu’il évoque son “pace”, sa vitesse, son dénivelé positif, et évidemment ses “Personal Best”.

C’est donc un terrain de jeu idéal pour qui veut s’amuser à rendre intelligibles des données trop peu valorisées dans un classement vertical classique.

De plus, j’étais curieux de pouvoir valider certaines impressions en visualisant les arrivées de ce classement.

Avec Florian, notre Data Chemist, on a commencé par récupérer les données et chercher une représentation graphique en cohérence avec ce que l’on souhaitait visualiser.

Rapidement nous nous sommes arrêtés sur un nuage de points (ScatterPlot), où chaque point représenterait un coureur, et où l’axe des abscisses serait une projection minute par minute du temps de chaque coureur.

Un petit coup de main de l’extraordinaire librairie D3.JS pour le côté technique, et il ne restait plus qu’à regarder ce que les données voulaient bien nous dire.

La première chose que je voulais voir, c’est si réellement les coureurs étaient motivés par les chiffres ronds

Beaucoup de coureurs se fixent comme objectif de passer une certaine “barre” symbolique. Sur semi marathon, la barre peut être celle de 1h30, 2h, ou 2h30 en fonction du niveau des participants.

Lors de cette course il y avait 3 coureurs d’allure. Ils emmenaient les coureurs sur les bases de 1h45, 2h et 2h15.

En positionnant les coureurs minute par minute, il était facile de voir si les coureurs ont tout fait pour essayer de passer en dessous de ces paliers ou non.

Et en effet il est amusant de voir que pour la barre des 2h, il y a 16 coureurs qui finissent en 1h59, alors que seulement 3 finissent en 2h00.

Les 16 coureurs ont sprinté sur la fin de course pour passer la barre des 2h. On retrouve ce phénomène avec une moins grande ampleur à 1h45 et à 2h15.

Deuxième donnée intéressante que je voulais approfondir, c’est la distribution par tiers des coureurs avec leur temps d’arrivée. Mon envie était de savoir si la plupart des coureurs arrivaient ensemble en peloton.

Les données ont pu montrer que :

  • le premier tiers s’étalait sur 37 minutes
  • le troisième sur 49 minutes
  • alors que le second tiers se concentrait seulement sur 17 minutes.

L’arrivée du semi marathon suit donc une loi normale avec une courbe en cloche classique.

Le temps moyen pour un semi marathon est plutôt en dessous de 2h (1:58) alors que pour celui de Porto Vecchio, il est un peu plus lent (2:04).

Pas forcément étonnant car le profil est plus accidenté qu’un semi marathon classique avec plus de 300 mètres de dénivelé positif.

Enfin, pour les participants à la course, nous avons mis à disposition un petit outil de recherche interactive sur le numéro de dossard, le nom du coureur ou sa catégorie. L’idée est d’utiliser la visualisation de données pour mieux contextualiser sa performance par rapport aux autres qu’au travers d’un classement classique.

Lien vers la visualisation de données : http://www.marathon.do/smpv

PS : L’idée de cette visualisation s’inspire librement du travail réalisé par Upshot du New York Times en avril dernier : http://www.nytimes.com/2014/04/23/upshot/what-good-marathons-and-bad-investments-have-in-common.html