Image for post
Image for post

Là encore voilà un concept qui a le vent en poupe ces derniers temps ! Dans le monde du travail actuel, la Data a une importance forte dans le (bon) fonctionnement des entreprises et rythme les décisions à tous les échelons. Mais comment s’assurer que cette Data est propre, sécurisée, convenablement stockée, non-obsolète? Cette “charte” à suivre de la Data n’est autre que la Data Gouvernance.

Une petite définition

Plusieurs définition ont été énoncées aux fils des ans mais nous pouvons retenir celle du Data Governance Institute :

Data Governance is a system of decision rights and accountabilities for information-related processes, executed according to agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods. …


Image for post
Image for post

Dans un premier article nous évoquions pourquoi envisager la méthodologie DataOps. Maintenant que nos esprits sont persuadés de la valeur ajoutée de cette méthodologie nous allons pourvoir la décrire plus précisément et voir comment la mettre en place.

Un peu d’histoire…

Si le DataOps est né du DevOps, attention les deux sont bien différents ! Sur le fond les bases sont semblables avec la volonté de réunir la partie développement et opérationnelle d’un projet, dans notre cas appliqué au cycle de vie complet de la donnée.

Les personnes concernées et les attentes entre les deux concepts sont bien différents :

Image for post
Image for post

Par ailleurs les concepts utilisés avec le DevOps tels que l’intégration continue, la notion de “delivery”, de monitoring, de scalabilité sont appliqués par les Data Engineers et le sont désormais aussi côté Data Scientists. …


Image for post
Image for post

La méthodologie DataOps devient une alternative plus que viable dans une entreprise où la donnée représente un enjeu fort. Les entreprises se voulant data centric passent par une gouvernance forte de la donnée, où le DataOps est la colonne vertébrale. Mais avant de pouvoir se qualifier de data centric, il y a beaucoup d’aspects qui nécessitent d’être abordés.

La mise en place d’une nouvelle méthodologie implique le changement de l’actuelle méthode qui n’est plus efficace et qui ne répond plus au besoin.

Un objectif: Minimiser le temps de cycle data !

Le temps de cycle data* est le temps qu’il faut pour une équipe Data (data engineers, data scientists, data analysts) pour délivrer un service et/ou produit. Ce temps est variable et souvent long. La principale raison est que nos équipes sont très souvent soumises à besoin urgent ou à un représentant du métier voulant une réponse rapide à sa demande. Ce temps est souvent beaucoup plus court que celui nécessaire pour l’implémentation. C’est donc ce décalage entre les attentes utilisateurs et les annonces faites par les différents développeurs qui sont la source de frustrations. …

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store