La Data Gouvernance

Pierre-Alexandre Maury
YounitedTech
Published in
4 min readSep 24, 2019

Là encore voilà un concept qui a le vent en poupe ces derniers temps ! Dans le monde du travail actuel, la Data a une importance forte dans le (bon) fonctionnement des entreprises et rythme les décisions à tous les échelons. Mais comment s’assurer que cette Data est propre, sécurisée, convenablement stockée, non-obsolète? Cette “charte” à suivre de la Data n’est autre que la Data Gouvernance.

Une petite définition

Plusieurs définition ont été énoncées aux fils des ans mais nous pouvons retenir celle du Data Governance Institute :

Data Governance is a system of decision rights and accountabilities for information-related processes, executed according to agreed-upon models which describe who can take what actions with what information, and when, under what circumstances, using what methods.

Dans l’absolu ce concept ne nous est pas vraiment étranger, il consiste a définir le cadre, la stratégie qui garantit la sécurité de l’utilisation de cette donnée.

Mais c’est plus facile à dire qu’à faire! Les sujets autour de la Data et son côté transverse font que la définition d’une méthode et la mise en place d’une bonne data gouvernance devient tout de suite beaucoup plus complexe.

La data gouvernance va faire appel aux différents services producteurs de données, au CDO* qui en est responsable et surtout au Data Steward* qui sera là pour faire le lien entre la plateforme de data gouvernance et les consommateurs de la donnée. Nous verrons son rôle plus en détail dans la suite de cet article.

Son développement

Afin de développer une bonne culture Data au sein de l’entreprise, trois actions principales doivent être menées:

  • Démanteler les silos organisationnels pour permettre une meilleure collaboration entre les services sur les sujets autour de la donnée.
  • Adhérer aux méthodes de data gouvernance prônant la transparence et la responsabilité sur la donnée.
  • Mettre en place de nouvelles règles impliquant et sensibilisant plus les collaborateurs et les utilisateurs finaux sur les enjeux de la donnée.

Pour réaliser ces trois chantiers l’entreprise et le CDO doivent s’engager sur plusieurs points clés:

La disponibilité de la donnée

L’ensemble des données produites par les différents services doit être connue et sauvegardée afin de la mettre à disposition des utilisateurs (en leur spécifiant des droits d’accès). La question de la sauvegarde est importante dans la cas d’une interruption de globale de service afin de pouvoir rejouer les éventuels scénarios.

La connaissance globale de la donnée passe par une cartographie de celle-ci et des outils qui la gèrent. Cet ensemble permettra de mieux maîtriser son périmètre et d’avoir les atouts nécessaires pour améliorer le pilotage de l’entreprise.

La disponibilité de la donnée ne doit pas occulter un autre aspect fondamental: sa suppression. Car le stockage d’une donnée obsolète ou illégale (suite à une demande d’anonymisation par exemple) va à l’encontre d’une bonne gouvernance Data.

La sécurité de la donnée et sa traçabilité

La mise en place d’une politique de sécurisation des données de l’entreprise et de ses clients est nécessaire (et obligatoire !) pour une bonne gouvernance.

Cette politique passe par le contrôle des accès aux différentes sources de données de l’entreprise. Avoir un mécanisme d’anonymisation (GDPR). Tracer l’activité des collaborateurs sur les différents outils ayant un accès à la donnée, etc. La traçabilité sera assurée avec la transparence totale de la chaîne d’approvisionnement de la donnée. Tout changement sur ce pipeline devra être tracé. Ce qui améliorera d’autant plus la confiance des utilisateurs dans la donnée mise à disposition en bout de chaîne.

La qualité et l’intégrité de la donnée

Les différents services doivent s’assurer de la qualité de la donnée qu’ils produisent mais aussi de celle qu’ils consomment. L’assurance de l’intégrité passe aussi par le contrôle de la cohérence, de la pertinence de celle-ci. Il faut aussi vérifier que la transmission de la donnée se fait sans incident et que son écriture est assurée.

La mise en place de la gouvernance est une chose, mais son suivi est encore plus important car l’entreprise et ses différents services vont évoluer. Le modèle devra donc continuer à vivre. Ce suivi est réalisé par le Data Steward qui sera donc en charge de la gestion de la donnée au niveau de l’entreprise.

Son maintien et son suivi

Comme énoncé juste au dessus, le rôle du Data Steward va être prépondérant dans l’exécution dans le temps de la stratégie. En effet c’est le garant de la connaissance technique et fonctionnelle de l’environnement de donnée. En étant le référant de la Data Gouvernance, c’est directement à lui qu’il faut s’adresser s’il y a la moindre interrogation.

Il agit en facilitateur d’accès à la donnée et s’assure que la provenance et la fraîcheur de celle-ci respecte des les standards définis dans le cadre de la Data Gouvernance. Il sera directement impliqué dans les échanges avec les différentes équipes Data (Data Engineers, Scientists et Analysts).

Même si le travail du Data Steward est de maintenir le “bateau” Data Gouvernance à flot il ne faut pas oublier que la réussite de cette stratégie dépend de tous les acteurs de la donnée dans l’entreprise. Que ce soit le producteur, le transformateur ou même le consommateur de celle-ci. La qualité de la mise en place d’une telle vision data passe par la remise en question des procédés actuels, l’ouverture d’esprit et l’écoute de chacun.

*CDO : Le Chief Data Officer joue un rôle clé dans la définition de la stratégie globale de l’entreprise. Il a pour but de faciliter l’accès aux données, il doit s’assurer de la fiabilité de celles-ci pour pouvoir les exploiter et les analyser, et ainsi permettre à la Direction de prendre les meilleures décisions. Il est directement an charge des différentes équipes Data (Engineer, Scientist, Analyst) qui lui permettent de réaliser ces objectifs.

--

--