T’as vu ta tête, pastèque?

Published in

data-science.be

5 min readNov 7, 2017

Quand les grands cousins viennent à la maison, l’obsession de ma petite fille de 4 ans, c’est le smartphone de sa cousine. Pas parce qu’il a une coque de protection à oreilles de chat, mais parce qu’il a … Snapchat!

Mathilda est fascinée par les filtres qui permettent de transformer les visages, de leur chausser des lunettes de soleil, des nez de chat, des yeux de poupées. Son filtre préféré, et de loin, c’est la pastèque qui vomit — la classe. Sa grande cousine cadre son joli minois dans l’écran, lui dit d’ouvrir la bouche et là, j’entends le rire hilare et un peu coupable que ma fille essaie de couvrir avec ses petites mains potelées. “Rhooo, ze suis une pastèque qui vomit”.

Derrière l’attraction un peu niaise se cache en réalité un tour technologique massivement utilisé de nos jours : la reconnaissance d’image et, en l’occurrence, la reconnaissance faciale qui, bien qu’elle ait été dernièrement utilisée à des fins controversées ou douteuses, est une application de la data science. C’est le même principe qui permet à votre appareil de prendre une photo au moment exacte où votre sujet sourit ou à cette application de vous faire perdre ou gagner quelques années en deux clics.

Comment ça fonctionne?

Hé bien, à peu de chose près, comme un humain apprend à reconnaître une image. Prenons un exemple très simple : prenons une poule. Depuis qu’ils sont en âge de rester attentifs 10 secondes d’affilée, je montre à mes enfants des images d’animaux. Des vaches, des cochons, des poules. A force d’en voir passer, mes enfants reconnaissent les signes caractéristiques d’une poule : un petit corps arrondi, un bec, une crête rouge, des pattes jaunes orangées, un collier de plumes, une couleur blanche ou rousse et enfin le son “cot-cot”. C’est du feature extraction, exactement comme en informatique : le sujet apprenant détermine une série de caractéristiques qui définit l’image, un algorithme.

Au début, mes enfants se trompent un peu et confondent le coq et la poule, mais bientôt, avec mon aide et un peu d’entraînement, ils perfectionnent l’algorithme de la poule : ils sauront que les deux features du coq qui le différencient de la poule sont la queue multicolore à l’arrière-train et le son “cocorico”.

Par la suite, à chaque fois qu’une nouvelle stimulation visuelle parviendra à mon enfant, il pourra lui même évaluer l’image à l’aide d’une matrice de features et dire si oui ou non (1 ou 0), l’image contient les caractéristiques de la poule. Quand mon fils de 15 mois aperçoit le coq dans le jardin de sa grand-mère et qu’il pointe son petit doigt en s’exclamant : “Co! Co!”, il applique son algorithme du coq et reconnaît, effectivement, un coq dans le jardin.

Le concept, vous l’aurez compris, c’est de traduire l’objet en un langage compréhensible par un ordinateur : ci-dessus une suite de 1 et de 0, ou dans l’exemple suivant, un point dans un graphique.

Pour Mathilda, une petite fille se définit par la longueur de ses cheveux et le pourcentage de rose dans ses vêtements. Si on représentait les 16 enfants de sa classe dans un graphique, cela donnerait ceci:

Dans ce graphique, l’axe des x représente la longueur des cheveux et l’axe des y, le pourcentage de rose dans les choix vestimentaires. On voit clairement deux nuages de points bien distincts. La ligne tracée au milieu, c’est le modèle qui permet de dire à Mathilda : si les cheveux > 20 cm et le rose > 50% de la surface vestimentaire, alors l’enfant est une fille. Si les cheveux < 20 cm et le rose < 50% de la surface vestimentaire, alors l’enfant est un garçon.

Aucun modèle n’est parfaitement infaillible. L’année passée, la petite Noéline avait les cheveux coiffés à la garçonne et, a priori, pas tellement de vêtements girly dans sa garde robe. Mathilda a défendu mordicus pendant des mois que Noéline était un petit garçon. Par contre, quand elle voit son meilleur ami débarquer en sorcière fuchsia à Halloween, il ne fait aucun doute que Tiago est toujours bien un petit garçon.

Avant de transformer ma fille en pastèque, Snapchat a appris à reconnaître des milliers de visages et donc, a déterminé une série de critères qui définit un visage : un ovale, deux yeux, un nez, une bouche… L’algorithme de Snapchat reconnaît un visage et, ensuite, le modèle transforme en pastèque tel que : Modèle 1 : quand tu reconnais un visage, transforme-le en pastèque.

De même, un second algorithme a appris à différencier une bouche fermée d’une bouche ouverte. Le modèle qui s’ensuit fait élégamment vomir le sujet : Modèle 2 : quand la bouche s’ouvre, simule un jet de jus de pastèque.

Aujourd’hui, la reconnaissance d’image est utilisée dans des contextes populaires et parfois assez futiles pour vous permettre de tester du maquillage ou de retrouver toutes les photos de votre bébé dans Google Photos. Pourtant, elle est en passe de devenir déterminante pour certains secteurs, comme les assurances, le suivi hospitalier, la sécurité et les médias, dans lesquels les images sont nombreuses, variées et critiques.

Et vous? Voici quatre questions que vous pouvez vous poser avant d’adopter la reconnaissance d’image.

Votre entreprise utilise-t-elle les images? Si oui, lesquelles?
Quelle est l’utilité de ces images? Servent-elles au diagnostic, à la documentation, à la prise de décision?
Sont-elles exploitables, c’est-à-dire numérisées, stockées, de bonne qualité, accessibles en termes de droits (droit d’auteur, droit à l’image, etc.)?
Quel serait le gain d’automatiser le traitement de ces images : diminution de coût, gain de temps, meilleure performance?

Si oui, alors vous aussi, vous aurez un jour votre pastèque qui vomit!

T’as vu ta tête, pastèque?

Written by Maryse Colson