La Data Gouvernance

Image for post
Image for post

Là encore voilà un concept qui a le vent en poupe ces derniers temps ! Dans le monde du travail actuel, la Data a une importance forte dans le (bon) fonctionnement des entreprises et rythme les décisions à tous les échelons. Mais comment s’assurer que cette Data est propre, sécurisée, convenablement stockée, non-obsolète? Cette “charte” à suivre de la Data n’est autre que la Data Gouvernance.

Une petite définition

Plusieurs définition ont été énoncées aux fils des ans mais nous pouvons retenir celle du Data Governance Institute :

Data Governance is a system of decision rights and accountabilities for information-related processes, executed according to agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods.

Dans l’absolu ce concept ne nous est pas vraiment étranger, il consiste a définir le cadre, la stratégie qui garantit la sécurité de l’utilisation de cette donnée.

Mais c’est plus facile à dire qu’à faire! Les sujets autour de la Data et son côté transverse font que la définition d’une méthode et la mise en place d’une bonne data gouvernance devient tout de suite beaucoup plus complexe.

La data gouvernance va faire appel aux différents services producteurs de données, au CDO* qui en est responsable et surtout au Data Steward* qui sera là pour faire le lien entre la plateforme de data gouvernance et les consommateurs de la donnée. Nous verrons son rôle plus en détail dans la suite de cet article.

Son développement

Afin de développer une bonne culture Data au sein de l’entreprise, trois actions principales doivent être menées:

  • Démanteler les silos organisationnels pour permettre une meilleure collaboration entre les services sur les sujets autour de la donnée.
  • Adhérer aux méthodes de data gouvernance prônant la transparence et la responsabilité sur la donnée.
  • Mettre en place de nouvelles règles impliquant et sensibilisant plus les collaborateurs et les utilisateurs finaux sur les enjeux de la donnée.

Pour réaliser ces trois chantiers l’entreprise et le CDO doivent s’engager sur plusieurs points clés:

L’ensemble des données produites par les différents services doit être connue et sauvegardée afin de la mettre à disposition des utilisateurs (en leur spécifiant des droits d’accès). La question de la sauvegarde est importante dans la cas d’une interruption de globale de service afin de pouvoir rejouer les éventuels scénarios.

La connaissance globale de la donnée passe par une cartographie de celle-ci et des outils qui la gèrent. Cet ensemble permettra de mieux maîtriser son périmètre et d’avoir les atouts nécessaires pour améliorer le pilotage de l’entreprise.

La disponibilité de la donnée ne doit pas occulter un autre aspect fondamental: sa suppression. Car le stockage d’une donnée obsolète ou illégale (suite à une demande d’anonymisation par exemple) va à l’encontre d’une bonne gouvernance Data.

La mise en place d’une politique de sécurisation des données de l’entreprise et de ses clients est nécessaire (et obligatoire !) pour une bonne gouvernance.

Cette politique passe par le contrôle des accès aux différentes sources de données de l’entreprise. Avoir un mécanisme d’anonymisation (GDPR). Tracer l’activité des collaborateurs sur les différents outils ayant un accès à la donnée, etc. La traçabilité sera assurée avec la transparence totale de la chaîne d’approvisionnement de la donnée. Tout changement sur ce pipeline devra être tracé. Ce qui améliorera d’autant plus la confiance des utilisateurs dans la donnée mise à disposition en bout de chaîne.

Les différents services doivent s’assurer de la qualité de la donnée qu’ils produisent mais aussi de celle qu’ils consomment. L’assurance de l’intégrité passe aussi par le contrôle de la cohérence, de la pertinence de celle-ci. Il faut aussi vérifier que la transmission de la donnée se fait sans incident et que son écriture est assurée.

La mise en place de la gouvernance est une chose, mais son suivi est encore plus important car l’entreprise et ses différents services vont évoluer. Le modèle devra donc continuer à vivre. Ce suivi est réalisé par le Data Steward qui sera donc en charge de la gestion de la donnée au niveau de l’entreprise.

Son maintien et son suivi

Comme énoncé juste au dessus, le rôle du Data Steward va être prépondérant dans l’exécution dans le temps de la stratégie. En effet c’est le garant de la connaissance technique et fonctionnelle de l’environnement de donnée. En étant le référant de la Data Gouvernance, c’est directement à lui qu’il faut s’adresser s’il y a la moindre interrogation.

Il agit en facilitateur d’accès à la donnée et s’assure que la provenance et la fraîcheur de celle-ci respecte des les standards définis dans le cadre de la Data Gouvernance. Il sera directement impliqué dans les échanges avec les différentes équipes Data (Data Engineers, Scientists et Analysts).

Même si le travail du Data Steward est de maintenir le “bateau” Data Gouvernance à flot il ne faut pas oublier que la réussite de cette stratégie dépend de tous les acteurs de la donnée dans l’entreprise. Que ce soit le producteur, le transformateur ou même le consommateur de celle-ci. La qualité de la mise en place d’une telle vision data passe par la remise en question des procédés actuels, l’ouverture d’esprit et l’écoute de chacun.

*CDO : Le Chief Data Officer joue un rôle clé dans la définition de la stratégie globale de l’entreprise. Il a pour but de faciliter l’accès aux données, il doit s’assurer de la fiabilité de celles-ci pour pouvoir les exploiter et les analyser, et ainsi permettre à la Direction de prendre les meilleures décisions. Il est directement an charge des différentes équipes Data (Engineer, Scientist, Analyst) qui lui permettent de réaliser ces objectifs.

YounitedTech

Le blog Tech de Younited, où l’on parle de développement…

Thanks to Nicholas Suter

Pierre-Alexandre Maury

Written by

YounitedTech

Le blog Tech de Younited, où l’on parle de développement, d’architecture, de microservices, de cloud, de data… Et de comment on s’organise pour faire tout ça. Ah, et on recrute aussi, on vous a dit ?

Pierre-Alexandre Maury

Written by

YounitedTech

Le blog Tech de Younited, où l’on parle de développement, d’architecture, de microservices, de cloud, de data… Et de comment on s’organise pour faire tout ça. Ah, et on recrute aussi, on vous a dit ?

Medium is an open platform where 170 million readers come to find insightful and dynamic thinking. Here, expert and undiscovered voices alike dive into the heart of any topic and bring new ideas to the surface. Learn more

Follow the writers, publications, and topics that matter to you, and you’ll see them on your homepage and in your inbox. Explore

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic. Write on Medium

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store