Au-delà des cailloux, ou Ce qui fait un bon data scientist

Maryse Colson
data-science.be
Published in
5 min readAug 22, 2017

Premier article après une looooongue période de vacances! Me revoilà, toute iodée et de marinière vêtue, prête à vous concocter et à vous conter de nouvelles histoires sur la data science, telles qu’on les écrit en Belgique. Je reviens de Bretagne, là où la terre s’arrête et où le bleu s’étend à perte de vue… Ou le gris, c’est selon. Mon mari et moi sommes amoureux de la Bretagne, de ses plages encore sauvages, de ses luxuriants massifs d’hortensias, de sa gastronomie authentique et savoureuse (quelques huîtres avec un petit sancerre? une bolée de cidre avec votre galette? yes, please!). Cependant, là où mes vieux restes de philologiste romane s’émeuvent devant le château de Brest ou la forêt de Brocéliande, devant les vestiges de l’histoire et des légendes, devant les traces de ceux qui nous ont précédés, mon mari préfère les sites naturels, les rochers escarpés et les phares battus par vents et marées.

Il est photographe.

Comprenez : là où je vois un tas de cailloux, David voit un promontoir qui ferait sautiller de joie Châteaubriant et Charlotte Brontë. Là où il n’y a qu’un bête phare pas bien joli, David voit un nouveau fief pour Game of Thrones. Il voit un rocher, imagine un cadre, place son appareil photo, fait quelques réglages et hop, la nature devient une image.

Et c’est seulement quand je vois l’image que je me dis, quand même, c’est joli toutes ces pierres entourées d’écume ouatinée. Ses photos me donnent une grille de lecture, elles me permettent de comprendre ce qui, par nature, ne me touche pas. Elles m’indiquent où se trouve la beauté, elles me montrent où est l’intérêt d’un endroit que je ne soupçonnais pas.

Un data scientist, c’est comme un photographe.

Face à des données, à un problème ou à un objectif à atteindre, il saura imaginer un cadre, choisir son algorithme, délimiter un ensemble de données et hop, les données deviendront un message. Il les rendra lisibles, limpides, utiles.

Thomas et Guillaume sont data scientists chez EURA NOVA. Ils travaillent actuellement pour une agence qui place des publicités sur mobile. Ce matin, Thomas me racontait comment Guillaume et lui avaient réussi à affiner un taux de catégorisation en utilisant un concept mathématique de base.

“ Notre client a un ensemble d’éléments, notamment définis par le temps, qu’il souhaite catégoriser. Or, il a choisi de considérer les heures comme des catégories. Ce n’est pas une mauvaise idée en soi, mais il existe un rapport entre les heures qu’on ne peut pas traduire si l’on considère les heures comme des catégories. Par exemple, 1h est plus proche de 3h que de 15h : comment traduire cela avec des catégories? C’est impossible.”

“ Ce que nous avons fait? Nous avons utilisé les sinus et cosinus. [Note de la rédactrice : vous le sentez, là, le revival des cours de math fortes de votre année de rhéto?] Les heures sont traditionnellement représentées sur un cercle, tout comme les sinus et les cosinus qui permettent d’associer des coordonnées à un point du cercle décrit par un angle. Nous avons donc associé à chaque heure un angle a et un point sur le cercle dont les coordonnées sont cos (a), sin (a). Grâce à cet artefact, nous avons pu reconsidérer la catégorisation en établissant des rapports entre les heures : la classification a gagné en précision, notre client a vu ses données sous un angle neuf et a tout de suite repérer de nouvelles opportunités”.

“C’est amusant, non?” ponctue Thomas. [Note de la rédactrice : Oui, les data scientists ont un humour bien à eux].

Oui, Thomas, c’est amusant. Et ce qui me plaît surtout, c’est que Thomas aime me le raconter, me l’expliquer. Le data scientist n’est pas jaloux de son art, il cherche à le partager. Son but n’est pas d’être le surpuissant mathématicien dont on ne peut se passer, son but est de résoudre un problème.

Je me souviens de ce jour où nous étions encore à la maternité avec bébé n°2. David, assis dans l’inconfortable fauteuil de la chambre d’hôpital, tenait notre petit garçon tout contre lui. “Tiens, me dit-il en montrant son appareil photo, tu me prendrais bien en photo avec lui!”. Moi, prendre une photo? Quel risque ne prendrait-il pas pour hashtaguer #fatherandson! Le premier cliché est très laid, je le montre à David qui sourit, un peu navré de mes talents de photographe. Sans faire bouger d’un cil notre bébé endormi, il pousse sur un bouton, décale la molette de trois crans et me conseille de me rapprocher de lui pour prendre la photo. Je recommence : le second cliché est parfait et est aujourd’hui fièrement accroché dans notre salon.

De plus en plus de sociétés travaillent avec des data scientists qui les aident à développer leurs opportunités d’affaire. Souvent, les data scientists ont ce rôle de “smart guy” qui débarque sur le terrain, vierge de tout apriori et qui, entre ses pouces et ses index croisés, porte un regard neuf sur le business et les données. Mais parfois, les data scientists sont là pour transmettre et partager : d’abord pour pousser sur les boutons à votre place, et plus tard pour vous demander “Alors, sur quel bouton tu vas pousser?” et vous expliquer pourquoi c’est le bleu et pas le vert.

Pensez-y, lorsque vous engagerez un data scientist : laissez-vous surprendre par la manière qu’il aura de résoudre en un claquement de doigt le problème que vous trouviez insoluble. Et surtout, amusez-vous à vous faire expliquer la solution : il n’y a pas de meilleur data scientist que celui qui sait rendre l’infiniment complexe merveilleusement clair.

--

--

Maryse Colson
data-science.be

Inspired by real life and people. Tell stories about data science changing the world. Work @ EURA NOVA