Pourquoi envisager la méthodologie DataOps ?

Pierre-Alexandre Maury
YounitedTech
Published in
3 min readJan 2, 2019

La méthodologie DataOps devient une alternative plus que viable dans une entreprise où la donnée représente un enjeu fort. Les entreprises se voulant data centric passent par une gouvernance forte de la donnée, où le DataOps est la colonne vertébrale. Mais avant de pouvoir se qualifier de data centric, il y a beaucoup d’aspects qui nécessitent d’être abordés.

La mise en place d’une nouvelle méthodologie implique le changement de l’actuelle méthode qui n’est plus efficace et qui ne répond plus au besoin.

Un objectif: Minimiser le temps de cycle data !

Le temps de cycle data* est le temps qu’il faut pour une équipe Data (data engineers, data scientists, data analysts) pour délivrer un service et/ou produit. Ce temps est variable et souvent long. La principale raison est que nos équipes sont très souvent soumises à besoin urgent ou à un représentant du métier voulant une réponse rapide à sa demande. Ce temps est souvent beaucoup plus court que celui nécessaire pour l’implémentation. C’est donc ce décalage entre les attentes utilisateurs et les annonces faites par les différents développeurs qui sont la source de frustrations.

Face à cette situation inconfortable, de nombreux managers accompagnés de leurs développeurs utilisent le héroïsme pour résoudre le problème. Parfois, cette solution fonctionne ! Oui, mais au prix d’horaires à rallonge, de fatigue psychique accumulée et de stress évitable…

Une erreur : le héroïsme

Le héroïsme a le défaut de ne pas pouvoir se mettre à l’échelle et n’apporte donc pas l’élasticité nécessaire à l’ajout de travaux non prévus, comme la détection d’un dysfonctionnement en production.

Les héros sont souvent des personnes très compétentes travaillant dur et surtout aimant travailler sur les sujets nouveaux ou complexes qu’offre la Data mais qui vont très vite s’ennuyer à faire des tâches redondantes pouvant être issues d’une dette technique dont l’origine est ironiquement un développement expéditif livré par un héros sous la pression de l’urgence ! #ViciousCircle

Pour reprendre l’analogie de l’industrie: le héros est un goulot d’étranglement car l’équipe dans laquelle il se trouve peut être dépendante d’un bout de code que personne ne comprend sauf la personne l’ayant écrite. Le héros est donc très demandé par tous les membres de l’équipe ce qui engendre une baisse de la productivité de celle-ci.

Un challenge : gérer le travail non planifié

Le travail non planifié, c’est à dire celui qui n’est pas initialement présent dans le backlog/sprint, peut être un bug en production ou encore une demande très urgente du métier. Le temps dépensé pour réaliser ces travaux, dans une organisation ayant recours au héroïsme, engendre le gel des développements.

De plus, dans le cas où le projet venait à mal se passer, le héros est souvent tenu pour seul responsable alors qu’en vérité la personne à blâmer serait plus l’organisation qui l’a mis dans cette position. Par conséquent la clé pour le manager est de trouver un moyen de concilier le temps de cycle data sans avoir recours à au héroïsme ou encore accumuler de la dette technique.

Une solution : le DataOps

Il est possible de délivrer rapidement, de manière flexible et robuste des projets Data avec l’approche DataOps. Celle-ci promeut l’intégration continue et l’orchestration automatique. Ces trois piliers sont:

  • Le développement agile
  • L’approche DevOps
  • La maîtrise statistique des procédés

La mise en place de ces trois concepts dans une organisation Data permet aux équipes de diminuer le temps de cycle Data. Ce gain de temps laisse plus de place à l’innovation. Un prochain article se focalisera plus le DataOps et le développement des trois piliers.

* Temps de cycle data: Concept sur le temps mis par les équipe techniques Data(data engineers, data scientists, data analysts) pour délivrer un projet de bout en bout

--

--