Machine Learning et mobile : qu’en est-il en ce début 2018 ?

Le Machine Learning et l’IA ont été vendus un peu partout par les constructeurs. Qu’en est-il réellement ?

Florent Morin
Morin Innovation
5 min readJan 14, 2018

--

Rappel : je ne suis pas data-scientist. Les présentes informations sont limitées à mes connaissances en tant que spécialiste du mobile. Si vous souhaitez aller plus loin, n’hésitez pas à consulter les articles des spécialistes de l’intelligences artificielles.

Les usages actuels

Le Machine Learning est déjà présent dans les mobiles depuis un certain temps, mais sous des formes différentes.

Machine Learning sur les serveurs web

Cela fait un certain temps que le Machine Learning est en place chez Google et Apple pour effectuer des recherches dans vos photos par exemple. (Photos à la mer, photos de chien, etc)

Cela nécessite de passer par des serveurs, sur Internet. Le travail de Machine Learning est donc réalisé, au moins en partie, par des serveurs.

Chez Google, vos photos sont récupérées et analysées par Google. Ce qui donne un énorme avantage aux performances et à la facilité de mise en place, en contre-partie d’une vie personnelle un peu exposée à Google et ses partenaires.

Utilisation des données entrainées sur mobile

Chez Apple, la bibliothèques de photos iCloud est chiffrée, ce qui empêche quiconque de consulter vos photos (détaillé dans le guide de sécurité iOS) : la tâche de Machine Learning devient plus complexe. Le travail doit se réaliser, au moins en partie, sur mobile

Pour cela, des modèles pré-entrainés permettent d’avoir une base de référence. Le mobile n’a plus qu’à exploiter ces données. C’est plutôt performant et le respect de la vie privée est garanti.

Confidentialité différentielle

Pour conserver la confidentialité des données, Apple dispose d’un modèle plutôt complexe mais aussi très efficace : la confidentialité différentielle.

En gros, des données aléatoires sont injectées avant d’être envoyées à Apple. Ce “bruit statistique” empêche de faire le lien entre les données et l’utilisateur.

Comme ça, Apple peut avoir des statistiques d’usage sans avoir à espionner ses utilisateurs. Cela permet d’améliorer la complétion automatique sur le clavier, ou autre.

C’est complexe, mais c’est le seul moyen pour Apple de pouvoir continuer à vendre le respect de la vie privée.

Les assistants vocaux

Que ce soit Google Assistant ou Siri, chacun a son assistant.

1984 : une oeuvre qui illustre bien les enjeux actuels

Google profite d’une longueur d’avance sur l’interprétation des résultats. Son enceinte “Big Brother” Google Home Mini est offerte avec les box internet, au-delà d’un certain montant d’achat en boutique, avec les produits Nest, et autres partenaires commerciaux de Google. Ce qui va permettre au géant de la recherche et de la publicité sur Internet d’aller encore plus loin dans la conception de ses produits. En permettant au grand public de disposer d’un assistant et d’une enceinte (quasi-)gratuite, le géant va en contre-partie pouvoir disposer d’un panel de données absolument gigantesque. Ses clients et partenaires n’auront plus qu’à se servir.

Siri et The Rock, c’est du sérieux !

Apple a choisi une voie différente pour Siri. L’assistant vocal est en premier lieu conçu pour le respect de la vie privée. Il en va de même pour son enceinte connectée (et payante) HomePod, dont le niveau de sécurité a pour but de garantir la confidentialité des données. Au-delà de l’aspect confidentialité des données, l’objectif est donc de rendre Siri moins intelligent au début concernant la recherche d’informations mais au final plus efficace dans l’interprétation.

Chacun a donc sa propre trajectoire et son propre marché. Mais, de manière générale, les assistants progressent à vue d’oeil.

Sécurité

La plupart des systèmes d’identification par empreinte digitale apprennent à l’usage. En gros, si le système ne reconnait pas votre empreinte, que vous saisissez aussitôt le bon mot de passe, il va exploiter l’empreinte saisie juste avant pour améliorer son procédé de détection.

Face ID permet d’identifier un visage grâce (entre autres) à un réseau neuronal

Il en va de même pour Face ID, inauguré par Apple en 2017, qui utilise son réseau neuronal intégré pour reconnaître un visage grâce à environ 30 000 points captés par infrarouge. Ce procédé d’intelligence artificielle permet non seulement d’améliorer la détection à l’usage, mais aussi de détecter le visage même si on se maquille, laisse pousser les cheveux ou la barbe, porte des lunettes, etc.

Les solutions pour les applications tierces

Les applications tierces peuvent enfin tirer partie du Machine Learning directement sur l’appareil. Mais attention : uniquement pour exploiter des modèles pré-entrainés.

Exploitation des modèles

Apple propose depuis juin sur tous les appareils compatibles iOS 11 sa technologie Core ML.

Google propose, depuis le rachat de TensorFlow, la solution mobile TensorFlow Lite au travers de la technologie Neural Network API intégrée à Android 8.1.

Apprentissage

Côté apprentissage, il faut passer par des machines plus puissantes dans la plupart des cas.

Apple propose un convertisseur de modèles : Core ML Tools. C’est en Python, open-source, et cela gère la plupart des standards du marché. Afin de simplifier l’apprentissage, Apple vient également de mettre à disposition Turi Create. Cet outil simplifie le Machine Learning en s’affranchissant de la complexité du choix algorithmique.

Google propose l’outil TensorFlow, qui est une référence du marché. C’est un bel outil pour les data scientists. Très populaire.

L’avenir : un apprentissage sur le mobile ?

Sauf quelques experts du domaine, il est encore complexe de réaliser un apprentissage complet sur mobile.

La chose est un peu sur-vendue en ce moment. Mais il faut bien faire rêver clients et investisseurs. 😇

Peut-être que les systèmes vont profiter des réseaux neuronaux sur puce dans les prochains mois ? Après tout, la puce intelligente des derniers iPhone est capable d’opérer 600 milliards d’opérations par secondes.

Malgré tout, un autre problème va se profiler : la quantité de données nécessaire. En effet, pour entrainer une machine à reconnaître un objet, il faut plusieurs centaines de milliers voir millions de photos.

Espérons que les procédés d’apprentissage s’améliorent.

Bref : tout un programme !

Échanges et démos 🙂

Si vous souhaitez échanger sur le sujet et avoir quelques démos concrètes, je serai présent à plusieurs événements :

À bientôt !

--

--