Qu’est ce que le MLOps ?

Nicolas Risi
Data by Saegus
Published in
4 min readFeb 15, 2019

Aujourd’hui, les initiatives autour de la donnée se multiplient. Les champs du big data et de la datascience ont amené de nombreux cas d’usages, comme la maintenance prédictive, classification de mail, segmentation client, grâce à la quantité de données disponibles et des derniers modèles statistiques.

Mais le chemin jusqu’à la mise en production est souvent délicat et difficile, si bien que de nombreux projets s’arrêtent au stade du POC (Proof Of Concept). C’est là qu’intervient le MLOps.

Du Proof of concept à la Production

Le MLOps est une adaptation des pratiques Agiles, principalement Devops, utilisées dans le développement de software, au monde de la donnée, du big data.

La promesse est d’améliorer et d’optimiser le cycle de vie des projets de datascience, d’analyse de donnée, des produits orientés donnée, tant en terme de rapidité que de qualité.

En réalisant ces projets plus rapidement, et de meilleure façon, le MLOps permet de retrouver la confiance des entités métiers dans les projets orientés données en leur fournissant un haut niveau de service. « Confiez-nous des projets, nous les réaliserons de manière rapide et efficace, depuis leur développement jusqu’à leur mise en production». On va d’une part éviter le “shadow IT” ou l’externalisation et d’autre part, augmenter la quantité de projets exploitables et rendre l’entreprise plus « data driven ».

Pour atteindre cet objectif, il est nécessaire de travailler sur différents axes: la culture, le technique, et l’organisationnel.

L’axe culturel

De même que le DevOps, le MLOps est avant tout un changement culturel. On dit souvent « People over process over tools ». Nous allons tenter d’infuser quelques principes comme le Kaizen (culture de l’amélioration continue), la transparence et le partage. C’est d’autant plus important que de nombreux profils sont impliqués dans ces projets. On retrouve le data scientist, le data engineer, la sécurité, la production et le métier… et tous doivent s’accorder pour collaborer autour du projet.

L’axe technique

Parmi les leviers nous retrouvons des pratiques liées au DevOps:

  • Automatisation (CI / CD)
  • Tests unitaires
  • Bonnes pratiques & normes claires
  • Environnements
  • Gestion de version
  • Starter kit / Boilerplates
  • Monitoring
  • Scalabilité des services
Cycle DevOps

Avec néanmoins des spécificités liées aux projets de datascience:

  • Reproductibilité des résultats
  • Monitoring des performances du modèle, un modèle de prédiction bon aujourd’hui, ne le sera pas forcément demain
  • Mise à disposition de modèles, pour pouvoir utiliser le modèle dans une application, par exemple pour aider un conseiller en agence.

L’axe organisationnel

Une fois le modèle prédictif en production, il faut pouvoir le maintenir, résoudre les bugs quand ils arrivent. La datascience nécessitant des compétences spécialisées, l’entière responsabilité des bugs ne peut plus être laissée à une équipe de production. Il faut donc travailler sur l’aspect organisationnel pour redéfinir les rôles et responsabilités, mettre en place une gouvernance autour des projets.

Au-delà de ça, il est nécessaire que tous les acteurs soient mis dans la boucle dès le début du projet, chacun apportant sa pierre à l’édifice. On va chercher à redevenir “project centric”.

Ce sont les 3 principaux axes du MLOps pour garantir la réussite d’un projet data, du développement jusqu’à la mise en production.

Il m’apparaît important d’évoquer deux autres chantiers qui sont souvent gérés séparément mais sont étroitement liés au MLOps.

La gouvernance

Pour faire gagner du temps au DataScientist, qui est un des objectifs du MLOps, il est optimal qu’il puisse trouver la donnée nécessaire à son sujet et sa problématique, de manière simple et efficace. Au lieu d’aller faire le tour des services pour trouver la donnée intéressante, il est plus efficace qu’il puisse explorer la donnée existante, d’une manière qui puisse être autant technique que fonctionnelle. Par exemple, chercher toutes les données relatives au concept de paiement client.

Il est également indispensable avec le RGPD qu’il puisse savoir ce qu’il peut ou ne peut pas utiliser, dans le cadre de son projet.

L’adoption

Une fois que l’on a atteint l’objectif d’offrir un haut niveau de service sur les projets data, il est nécessaire de trouver de plus en plus de cas d’usage. C’est alors la phase d’acculturation et d’adoption auprès des entités métiers qui doit commencer. Il faut leur faire retrouver confiance dans les services proposés mais aussi les inspirer.

C’est indispensable pour réussir à transformer l’entreprise et en faire celle de demain.

--

--