🤖 Réseaux neuronaux pour les nuls

10 min readJun 3, 2017

On en parle partout de nos jours : santé, informations, robotique, smartphone, analyse de photo, etc… Tout le monde veut en utiliser et pourtant, la plupart des gens ignorent réellement comment ça marche en dessous.

Je vais essayer de d’expliquer et de faire comprendre ce sujet complexe et compliqué en 10 minutes ! 😅

Avant de rentrer dans le coeur du sujet, prenons l’exemple du fonctionnement d’un ordinateur classique…

1 — De l’ordinateur aux neurones

Un ordinateur a un fonctionnement assez simple de manière générale. On lui donne des données d’entrées (clavier, souris et autres périphériques), il fait alors un certain nombre d’opérations et on peut enfin voir des données de sorties (image, vidéo, impression…). L’usage semble assez simple donc, même si sa composition est un peu plus compliquée, mais elle reste logique !

On reviendra sur cet exemple de l’ordinateur plus tard…

A contrario, le cerveau humain est beaucoup plus complexe ! Les meilleurs scientifiques de notre monde ont encore des difficultés pour comprendre comment fonctionne l’intégralité de notre cerveau…

MAIS, il y a un composant de base de ce fonctionnement : les neurones.

Votre cerveau a des milliards de ces neurones. Tous ces neurones sont connectés les uns avec les autres pour créer ce grand réseau neuronal. Ils échangent ensemble grâce à des impulsions électriques qu’on appelle synapses.

Cette masse de synapses permet alors à notre cerveau de pouvoir réfléchir et d’avoir une conscience.

Un neurone possède un potentiel d’action. Il s’agit d’un pique d’énergie, s’il est au-dessus d’un certain seuil, alors il va déclencher une succession de déclenchement vers d’autres neurones.

Certains ingénieurs se sont inspirés de ce système pour nos ordinateurs pour créer des réseaux neuraux artificiels. L’idée est de créer des noeuds qui sont des connexions similaires aux neurones dans notre cerveau.

Pour qu’un réseau de neurones artficiel puisse être utilisé, on déclenche un noeud avec une donnée d’entrée et ce noeud va déclencher d’autres noeuds auxquels il est connecté.

En pratique, on préfère organiser un réseau de neurones artificiels (ANN) en couche.

Entrées + Cachées + sorties + Poids (gif)

Vous vous rappelez de l’exemple du fonctionnement d’un ordinateur ?

On organise les réseaux neuraux avec une couche de neurones d’entrées et de sorties bien définie. On définit aussi des liens directs entre les noeuds pour savoir où se dirige l’information c’est-à-dire comment elle se propage.

Pour finir, on assigne des nombres différents sur nos connexions que l’on appelle “poids” (ou “weight” pour les anglophones) pour que certaines connexions soient plus forte que d’autres comme les vrais neurones.

Enfin, on a une couche de neurones cachés (hidden layer) entre ceux qui définissent les entrées et les sorties. Ces neurones vont ainsi traiter les données.

Maintenant, on comprends un peu pourquoi quand on tape “neural network” dans Google, on voit des images avec plein de cercles reliées entre eux.

Maintenant, on comprend un peu mieux cette image !

2 — Comment prédire une donnée ?

Avant de sortir la boule de cristal, on doit se poser la question dans quel cas peut-on utiliser un réseau neural.

Il est admit que si le problème est statistique, alors un réseau neural pourra le résoudre. Pour des problèmes plus complexes, on combinera cette technique avec d’autres algorithmes (algorithmes génétiques par exemple) mais ça… on en parlera une autre fois !

Pour utiliser un réseau neural, on doit par un phase d’apprentissage. Prenons un exemple où toutes les données ne reflètent pas réalité, mais admettons qu’on ait fait un sondage et qu’on souhaite un modèle de réseau de neurones pour prédire un résultat.

Il existe 3 types d’apprentissages :

L’apprentissage supervisé
L’apprentissage non supervisé
L’apprentissage par renforcement

Ici, nous étudirons seulement l’apprentissage supervisé.

Pour qu’un réseau neural soit efficace, il faut l’entraîner et cela, avec un enemble de données classifiées.

Imaginons qu’on veuille déduire la préférence politique d’un futur électeur ! On aurait déjà plein d’informations, mais pour celles dont il manque un paramètre, que fait-on ? On utilise un réseau de neurones ! 🙂

Voici à quoi nos données peuvent ressembler :

Comment trouver le parti politique à partir d’informations qui n’ont presque aucun rapport ?

Pour faire simple, si on peut réduire notre problème à un tableau Excel alors celui-ci peut être résolu par un ANN.

Ici, on voudrait déterminer le parti politique d’un homme de 35 ans qui gagne 49 000€ avec un haut niveau d’étude.

Avant de commencer, il y a un élément à considérer : il a trois valeurs différentes pour l’éducation, deux pour le sexe, et trois pour les partis politiques. Parce qu’un réseau neural ne comprend que les chiffres, nous devons traduit “Haut/Moyen/Bas” en deux chiffres qui représentent ces 3 états :

Haut : 0.0 | 1.0
Moyen : 1.0 | 0.0
Bas : 0.0 | 0.0

On peut appliquer ce principe aux autres attributs. En informatique, il y a un principe fondamental : la normalisation des données.

La question qu’on pourrait se poser serait : “mais alors, pourquoi on a pas fait -1.0 ou 0.0 ou 1.0 sur un seul chiffre pour définir ces 3 états ?”. Là on rentre dans un autre problème de l’informatique qui mériterait un article très long (et très chiant) sur l’encoding. Encoder une donnée c’est traduire la réalité en chiffre.

La phase de normalisation est la plus importante dans le processus de création d’un réseau neural, il permet de traduire notre réalité par des chiffres afin qu’un réseau neural puisse le comprendre.

A l’initialisation de l’ANN, l’ensemble de nos neurones ont une valeur aléatoire.

Après une phase de Normalisation, de mise en place de notre réseau neural, et d’un apprentissage réussi, voici ce à quoi cela pourrait ressembler :

Utilisation d’un réseau neural spécialisé pour notre petit exercice[/caption]

On peut remarquer qu’en “Sortie” : il y a trois valeurs. Il s’agit là de probabilités de probabilités !

Techniquement, ces chiffres ne sont pas réellement des probabilités, mais on peut les interpréter comme tel. On peut donc lire :

La probabilité d’être de Gauche
La probabilité d’être de Droite
La probabilité d’être Autre

Comme il y avait 3 possibilités sur le parti politique et qu’on voulait obtenir ce dernier, on a logiquement 3 sorties qui correspondent à ces 3 possibilités.

De fait, la valeur la plus forte remporte à l’interprétation.

Simple, non ? 😀

Cet exemple a pour but de d’expliquer le fonctionnement global d’un ANN. Bien sûr, il existe bien d’autres manières d’appréhender cet outil pour résoudre bien des problèmes ! On a vu qu’une petite partie de ce qui se fait de mieux de nos jours.

3 — Comment se calcule un neurone ?

Maintenant, faisons un zoom sur un seul neurone. Maintenant qu’on a observé comment un ANN fonctionne, on va à présent regarder comment on calcule un neurone.

Quand on cherche sur Google pour trouver des informations sur du “neural network” on va forcément tomber sur Wikipédia et là on va nous parler de Perceptron.

On risques fort d’être perturbé pendant des jours à essayer de comprendre clairement ce que on lit, voire même d’embrouiller l’esprit.

Wikipédia ne permet pas encore de comprendre le fonctionnement d’un ANN (Artificial Neural Network), il y a trop peu d’informations à la porté de tous.

Je vais simplifier au maximum parce que le but c’est de comprendre les concepts principaux ! Désolé pour les puristes.

Il existe deux types de neurones, concentrons-nous sur un seul type : le neurone produit scalaire. L’autre type est le neurone de distance.

Pour simplifier, un neurone est un joli cercle, un “Perceptron”. Il en existe de plusieurs types.

Un neurone doit retenir un chiffre pour pouvoir se multiplier aux autres. Jusque là, c’est logique, on a des cercles avec des chiffres qu’on additionne et multiplie entre eux pour obtenir des probabilités sur un problème donné.

Comme j’ai expliqué précédemment, un neurone possède une valeur et les connexions entre chaque neurone ont une valeur nommée “poids” (ou “weight” dans la littérature). Cela veut donc dire qu’on va pouvoir utiliser ces nombres.

Voici un gif qui résume l’idée générale, que l’on va à présent détailler :

Pour calculer un Perceptron, voici trois étapes toute simples :

On multiplie un Perceptron et son poids en l’additionnant aux autres :

Cela donne : (0.10 x 4.0) + (0.20 x -5.0) + (0.30 x 6.0) = 1.20

Chaque Perceptron a un “faux neurone”, c’est-à-dire une constante qui est importante pour l’apprentissage.

Cela donne : 2.0 + 1.2 = 3.2

Pour plus d’informations sur cette constante, dirigez-vous dans la littérature des ANN pour avoir davantage d’explications.

On utilise une fonction d’activation (qu’on verra dans la section suivante) afin d’avoir un seuil sur le résultat précédent et ce, par rapport à une courbe. Cette étape est la sauce secrète des ANN.

Donc cela donne : Activation(3.2) = 0.73

Et voilà, on a la valeur de notre Perceptron (neurone).

Sans rentrer dans le détail, il existe de nombreuses fonctions d’activations, celle qui est assumée par défaut est la fonction sigmoïde.

Cette fonction a pour but d’établir un seuil d’une valeur où le neurone est stimulé ou pas. C’est comme un signal électrique, plus il est fort et plus on peut stimuler la lumière d’une ampoule.

Cette fonction d’activation va alors stimuler le potentiel d’action d’un neurone et, s’il est au-dessus d’un certain seuil il pourra propager son potentiel.

Le processus n’est pas si compliqué quand on admet certains postulats, lorsqu’on débute dans le sujet il vaut mieux éviter de se poser trop de questions. Il existe différents types de neurones, notamment un qui offert une mémoire à long terme permettant une plus grande précision dans de nombreux cas d’intelligence artificielle.

4-Rétro-propagation ou BackPropagation

Pour permettre un meilleur apprentissage d’un ANN, il faut un mécanisme capable de corriger une erreur de prédiction. Il s’agit là de la pièce manquante de notre exemple puisqu’on a vu à quoi ressemble un ANN, puis comment calculer un neurone, mais comment un ANN peut évoluer s’il se trompe sur le résultat final ?

Pour cela, on utilise un algorithme qui s’appelle la rétropropagation (du gradient). Cette propagation démarre de la dernière couche (Sortie) vers la première (Entrée). L’objectif est de modifier les poids de l’ensemble des connexions entre les neurones.

Sans rentrer dans le détail mathématique, prenons l’exemple d’un enfant que l’on gronde afin de lui faire comprendre que son comportement n’est pas approprié. Dans cet exemple, la rétroprogapagation transmet à son réseau neural l’apprentissage suivant : qu’il ne faut plus casser les vases de mamie.

Sur le réseau neural, durant la phase d’apprentissage, on va vérifier si le parti politique de notre exemple est correct. S’il ne l’est pas, alors on va effectuer un calcul pour modifier le poids des connexions et la valeur des neurones précédents. Ainsi, le neurone qui est le plus responsable de l’erreur sera susceptible d’être modifié davantage.

Au fur et à mesure de l’apprentissage, le nombre d’erreurs diminue : l’apprentissage est donc fini. On peut enfin utiliser notre ANN et l’utiliser pour calculer des probabilités sur un problème donné.

5 — D’autres sujets à voir

Le domaine des réseaux neuraux artificiels est un champ très vaste. A ce propos, voici différents sujets à explorer :

BackPropagation : la correction des erreurs d’apprentissage
Différentes fonctions d’activations
Deux autres paradigmes d’apprentissage : non supervisé et renforcé
Différents algorithmes d’apprentissage
Algorithm génétique
Deep Learning
Machine Learning
L’intelligence artificielle
Réseau Neural Récurrent
etc…

L’application des ANN sur le traitement d’information peut apporter de nouvelles opportunités.

Que ce soit dans la santé, où on peut maintenant détecter rapidement un cancer grâce à un réseau DeepLearning entraîné à voir des cellules cancéreuses.
Que ce soit dans la robotique, où un programme explicite ne sera plus nécessaire. A l’aide des algorithmes génétiques, on entraîne une IA a utiliser ses moteurs dans un espace virtuel avant d’être déployé dans son armature.
Que ce soit dans l’imagerie, pour déterminer le nom d’une plante voire si elle est commestible.
Que ce soit dans les statistiques, pour prédire les comportements de masses et éviter une catastrophe.
Que ce soit dans une ville, pour prédire si une agression pourrait avoir lieu à un moment précis à un endroit donné.

Ou encore mieux, pour pouvoir avoir des ennemis plus intelligents dans nos jeux vidéo ! Si on peut entraîner Mario à finir un niveau, alors on peut aller encore plus loin !

Les ANN ont ouvert une autoroute à la résolution de problèmes, les opportunités fleurissent sur tous les marchés.