On a toutes et tous un rôle à jouer dans la gouvernance des données

ICTC-CTIC
ICTC-CTIC
Published in
9 min readOct 27, 2021

S’appuyant sur de solides bases scientifiques en ingénierie et en STS (science, technologie et société), Lauriane Gorce (M. Sc.) contribue à des innovations — ce qui est nouveau — qui apportent un véritable progrès aux êtres humains et à notre planète — ce qui est mieux. Elle a travaillé en Europe, en Asie et en Amérique du Nord, couvrant différents aspects des innovations : traitement d’image et physique appliquée, politiques publiques d’innovation et développement durable, économie circulaire et infrastructure publiques, stratégie d’affaire et jeunes pousses technologiques, interculturalisme et gestion du risque industriel. Elle se penche actuellement sur des enjeux de gouvernance des données et d’intelligence artificielle à Nord Ouvert, un organisme à but non lucratif qui œuvre pour des données et technologies au service de communautés transparentes, responsables et inclusives. Par le biais de l’histoire fictive d’Hélène, Lauriane nous plonge dans son approche de la gouvernance des données. Elle fut développée en collaboration avec ses collègues à Nord Ouvert au cours de plusieurs projets. Toute ressemblance avec des personnes ou des organisations réelles est le fruit du hasard.

Ce matin ressemble à tous les autres pour Hélène, cheffe de sa division à Villes intelligentes Inc. depuis des années. Un café et quelques étirements plus tard, elle commence sa journée de télétravail. 10 a.m.: rencontre avec la directrice générale qui souhaite lui confier une nouvelle position exigée par le conseil d’administration, sûre qu’Hélène pourra se former rapidement et relever le défi. Elle accepte, fébrile. Elle est promue responsable de la gouvernance des données.

Sa première mission consiste à élaborer un plan d’action. Hélène est à la fois enthousiaste et terrifiée. Par le passé, elle a déjà touché à des données à travers des tableurs et des logiciels d’intelligence d’affaires, appuyée par des collègues plus techniques. De plus, elle a déjà gouverné : c’est une cheffe de division appréciée. Cependant, elle ne sait pas à quoi ressemble une bonne gouvernance des données pour des projets de ville intelligente.

À la découverte de données captivantes

Commencent alors les recherches. Hélène découvre qu’en informatique, une donnée numérique est une « représentation conventionnelle d’une information en vue de son traitement informatique 1 ».

Elle comprend que la combinaison de la prolifération des capteurs qui nous entourent, des coûts faibles du stockage des données et de calculs, explique le volume et la variété immense des données créées. Côté variété, on peut la décrire de plusieurs façons. Selon le sujet qu’elles couvrent, leur nature quantitative ou qualitative, le format de fichier dans lequel elles sont stockées (texte, son, vidéo, etc.), si elles sont structurées ou non (saviez-vous que 80–90 % des données générées aujourd’hui seraient non structurées ? 2)… Et on peut de plus les distinguer selon la fonction qu’elles remplissent dans les jeux de données (maître, référence, métadonnée ou transactionnelle 3), leur degré d’ouverture (fermé, partagé ou ouvert 4), leur origine (fournies librement, observées, dérivées ou déduites 5) ou encore leur degré de sensibilité (p. ex., identifiables, pseudonymisées, pseudonymisées non liées, anonymisées ou agrégées 6).

Une diversité nécessaire pour refléter la variété de nos représentations du monde

Quant à la quantité, Hélène apprend que le volume de données créées, capturées, copiées et consommées chaque jour dans le monde, en 2020, est estimé à 61,2 Zo (zettaoctets) 7. C’était seulement 2 Zo en 2010 8 et les prédictions pour 2025 en annoncent 180 Zo 9 ! Voyons, si 1 Mo (mégaoctet) représente 1 cm, 1 Zo représente environ 10 puissance 13 mètres, soit 75 fois la distance moyenne entre la Terre et le Soleil, et 180 Zo s’approchent des distances qui séparent les étoiles de notre galaxie !

Quantité de données créées, capturées, copiées et consommées chaque jour dans le monde selon l’année (en zettaoctets). * l’année 2025 est une estimation. Sources : IDC & Statista (2020) cités par Christo Petrov (2021) et Jakes B. (2021).

Hélène découvre ensuite 35 thèmes et enjeux prioritaires dans la prolifique feuille de route du collectif canadien en matière de gouvernance des données 10. Une personne peut-elle être l’unique responsable d’une tâche aussi colossale que la gouvernance des données ?

Nord Ouvert, un allié pour tout projet de ville intelligente

Hélène prend une pause et décide d’appeler son ami Henri qui travaille dans la municipalité d’à côté : que sait-il, lui, sur la gouvernance des données ? Henri lui apprend qu’il a suivi certains cours en ligne de Nord Ouvert sur la ville intelligente ouverte 11, et qu’aujourd’hui, sa ville travaille sur un plan de gouvernance des données avec le soutien gratuit de leurs services de consultation 12. À cette occasion, il a compris comment cet organisme à but non lucratif approche ce concept énigmatique qu’est la gouvernance des données. Il se fera un plaisir de le lui expliquer !

Déjà, Hélène a compris quelque chose de fondamental : les données sont construites

Celles-ci sont l’expression ou la représentation de certains éléments d’observation, de calculs, d’expériences ou d’enregistrement du monde réel… 13. C’est pourquoi elles n’existent pas en dehors des systèmes qui les ont créées. Seules, les données sont inertes et n’ont de valeur que potentiellement. Ce sont uniquement les décisions concernant les données qui permettent de réaliser cette valeur. Des exemples : acquérir ou non les données ; choix techniques et technologiques de captation, de stockage, de traitement, d’analyse ; les utiliser, exclure certains types de réemploi ou les supprimer.

Ces décisions sont prises quotidiennement, souvent de manière implicite, par plusieurs parties prenantes qui accordent différentes valeurs aux données tandis que d’autres parties impactées sont structurellement sous-représentées dans la prise de décision.

Reconnaître les déséquilibres structurels de pouvoir

Henri pique la curiosité d’Hélène : des parties prenantes structurellement sous-représentées ? Il lui apprend que les Premières Nations du Canada ont souhaité une stratégie coordonnée de la gouvernance des données pour incarner leur souveraineté, Nation par Nation 14. Autre exemple, la Fondation Mozilla a sélectionné 15 projets techniques guidés par des gens comme vous et moi, appelant une grande diversité d’horizons et de disciplines. Figurant dans la liste d’initiatives de la fondation, Black Communities — Data Cooperatives vise, dans leurs propres mots, à ce que les communautés noires aient plus de contrôle sur leurs données et leur utilisation dans l’intelligence artificielle 15.

Un outil essentiel pour des données de valeur

La gouvernance des données englobe tous les facteurs qui influencent les décisions relatives aux données, avec ou sans approche structurée. Néanmoins, la valeur potentielle des données ne peut être atteinte que par une gouvernance cohérente des données.

Henri insiste : cette gouvernance n’est pas intrinsèquement bonne ou mauvaise. Différents groupes ou individus peuvent accorder une valeur différente à un même jeu de données en fonction de leurs principes, de leur vision du monde ou de leurs intérêts. Intriguée, Hélène s’amuse à trouver des exemples. Au quotidien, elle souhaite mieux protéger sa vie privée alors que ses données sont convoitées notamment pour l’inciter à adopter de nouveaux comportements par le biais de publicités. D’un autre côté, elle désire plus de transparence dans les décisions politiques locales. Henri lui apprend qu’une gouvernance éthique, imputable et transparente est une des caractéristiques principales de la ville intelligente ouverte 16. Enfin, son entreprise voudra obtenir des données pour s’informer sur des sujets choisis ou même en faire des sources de revenus.

Henri poursuit : ces valeurs recherchées influencent dès le départ la manière dont les données sont construites. Elles orientent quels éléments sont représentés comme des données (et lesquels ne le sont pas).

Les pièces du casse-tête s’assemblent…

Hélène est prête. Elle saisit la complexité de la gouvernance des données.

Différentes couches d’analyse sont possibles : de l’individu à l’écosystème en passant par des organisations, seules ou en partenariat 17.

S’ajoutent des boussoles éthiques variées : les entreprises privées se cantonnent souvent à prioriser l’efficacité et les revenus financiers alors que toute organisation peut aussi prioriser ses valeurs, sa vision et sa mission.

Enfin, il existe une multitude de facteurs influençant les décisions. Par exemple, Nord Ouvert et le TIESS (Territoires innovants en économie sociale et solidaire) explorent le potentiel de la fiducie d’utilité sociale. C’est un instrument juridique québécois prometteur pour gouverner des données, car la fiducie définit une notion de contrôle sans la propriété de ces données. Elle permet aussi de placer un but précis (appelé « affectation ») au cœur de la gouvernance des données 18.

En résumé : différentes couches d’analyse, de boussoles éthiques et de facteurs influençant les décisions façonnent des interprétations très variées de la gouvernance des données. Pas étonnant qu’Hélène ait eu du mal à s’y retrouver !

… et la gouvernance des données émerge

Conséquence logique de cette diversité : il n’existe pas de solution clé en main. La gouvernance cohérente des données émerge au fur et à mesure des décisions qui la construisent, dans un contexte particulier. Pour cela, Villes intelligentes Inc. peut s’appuyer sur quatre éléments clés :

  • La stratégie, qui se concentre sur l’orientation et le soutien stratégiques de l’organisation en matière de gouvernance des données ;
  • La gestion des données, qui englobe les opérations quotidiennes reliées aux données ;
  • La culture, qui examine si les comportements individuels et l’environnement de travail créent un climat propice à la valorisation de la gouvernance des données ;
  • Les capacités, qui désignent le niveau de connaissances et de compétences des personnes impliquées dans la gouvernance des données.
Quatre éléments clés de la gouvernance des données

Et voici son plan d’action !

Hélène sourit, reconnaissante des connaissances partagées par son ami Henri. Ce fut une bonne journée. Elle peut sereinement préparer son plan d’action.

Son organisation doit identifier les jeux de données qui y transitent, la spécificité de leur contexte de données et les exigences légales qui en découlent.

Pour chaque jeu de données, Villes intelligentes Inc. doit continuellement clarifier ses intérêts et ses objectifs (les valeurs recherchées dans les données). Elle doit comprendre quelles décisions impactent le jeu de données, qui les prend, comment et à quel moment du cycle de vie des données. Il est important d’identifier les parties prenantes touchées par ces décisions et de leur donner les moyens de s’impliquer dans le processus en accordant une attention particulière à celles qui sont systématiquement sous-représentées.

Complémentaire à cette cartographie des décisions, il faut assurer l’alignement des orientations stratégiques de l’organisation avec ses pratiques quotidiennes de gestion des données, les comportements individuels et le climat de travail. Le tout en permettant aux parties prenantes d’acquérir les capacités appropriées afin qu’elles puissent elles aussi, à leur échelle, devenir responsables de la gouvernance des données.

Enfin, des mécanismes doivent être déployés pour rendre visibles et imputables les décisions relatives aux données. Ceux-ci clarifient qui prend les décisions, de quelle façon elles sont prises, et de quelle manière ces personnes sont tenues responsables.

Toutes et tous responsables de la gouvernance des données

Le lendemain, Hélène retrouve Henri autour d’un café. Elle lui raconte sa prise de conscience : ils font tous les deux partie d’un tout plus grand qu’eux. Alors que les données circulent et ne sont souvent que de passage, toutes leurs décisions comptent. Un peu comme pour la crise climatique, chaque décision compte d’autant plus quand elles sont prises au nom d’organisations. Chacune et chacun peut commencer dès aujourd’hui, une décision à la fois.

À propos. L’intention de cet article est de lancer une discussion sur la gouvernance des données. Il est fait pour être partagé localement et discuté avec un regard critique. N’hésitez pas à contacter Lauriane pour lui faire part de vos impressions et retours. Lauriane Gorce travaille à Nord Ouvert* qui œuvre pour des données et technologies au service de communautés transparentes, responsables et inclusives. Nord Ouvert mise sur la recherche, le renforcement des capacités et la collaboration intersectorielle et en réseau afin de faire avancer l’utilisation responsable et efficace des données et des technologies. Elle participe activement à plusieurs projets comme soutenir la gouvernance des données de l’écosystème de Montréal en commun ainsi que l’exploration des fiducies d’utilité sociale pour la gouvernance des données.
* Nord Ouvert est une organisation à but non lucratif fondée à Montréal, en 2011. Réunissant des spécialistes de la donnée et des technologies, leur champ d’expertise couvre les villes intelligentes et ouvertes, la mutualisation et la valorisation des données, la gouvernance des données, des technologies et de l’intelligence artificielle. Animées/Animés par leurs valeurs, elles/ils collaborent avec des partenaires publics, privés, du milieu de la recherche et de la société civile à travers le monde pour favoriser l’exploitation des données et des technologies dans l’intérêt du public. Nord Ouvert est un partenaire clé du programme Montréal en commun (le Défi des villes intelligentes du Canada), où il est responsable de coconstruire et de déployer un cadre de gouvernance des données.

Références

  1. https://www.larousse.fr/dictionnaires/francais/donn%c3%a9e/26436, consulté le 25 août 2021.
  2. Des données structurées sont clairement définies, facilement découvertes dans des bases de données organisées et peuvent être utilisées presque sans transformation par des algorithmes. Contrairement aux données non structurées qui requièrent plus de travail pour les comprendre, les traiter et les analyser. AI Unleashes the Power of Unstructured Data, CIO, 2019, https://www.cio.com/article/3406806/ai-unleashes-the-power-of-unstructured-data.html, consulté le 25 août 2021.
  3. Trusted Data Sharing Framework, IMDA & PDPC, 2019.
  4. The data spectrum, ODI, https://theodi.org/about-the-odi/the-data-spectrum/, consulté le 25 août 2021.
  5. Martin Abrams, « The Origins of Personal Data and its Implications for Governance », SSRN, 2014, https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2510927
  6. https://www.iso.org/obp/ui/fr/#iso:std:iso-iec:19941:ed-1:v1:en
  7. Christo Petrov, 25+ Impressive Big Data Statistics for 2021, 2021, https://techjury.net/blog/big-data-statistics/#gref, consulté le 25 août 2021.
  8. Jakes B., History of Data Creation, 10 février 2021, https://askwonder.com/research/history-data-creation-x90e34b6j, consulté le 25 août 2021.
  9. Christo Petrov, loc. cit.
  10. Conseil canadien des normes, Feuille de route du collectif canadien en matière de gouvernance des données, p. 6, 2021.
  11. Chaque cours dure environ 45 minutes et commence par les bases. Voir https://lms.opennorth.ca/accueil
  12. Contacter les services-conseils de Nord Ouvert : https://opennorth.ca/fr/advisory
  13. Steve Coutts et Sarah Gagnon-Turcotte, Data Governance and Digital Infrastructure: Analysis and Key Considerations for the City of Toronto, p. 12, 2020.
  14. FNIGC, et coll., First Nations Data Governance Strategy, 2020.
  15. Traduction libre de la présentation de l’initiative Black Communities — Data Cooperatives, un des groupes de travail ouvert à toute participante et tout participant, sélectionnés par la fondation Mozilla.
  16. « La gouvernance dans une ville intelligente ouverte est éthique, responsable et transparente. Ces principes s’appliquent à la gouvernance des plateformes sociales et techniques qui comprennent les données, les algorithmes, les compétences, l’infrastructure et les connaissances. » Traduction libre de Tracey P. Lauriault, Rachel Bloom, et Jean-Noé Landry, Open Smart Cities Guide V1.0, 2018.
  17. Sarah Gagnon-Turcotte, Miranda Sculthorp et Steve Coutts, Les partenariats de données numériques, OpenNorth, 2021.
  18. Fiducie d’utilité sociale de données : pour une gouvernance des données pour le bien commun, « S’approprier de nouvelles façons de faire », TIESS, 2021, https://tiess.ca/gouvernance-et-fiducie-de-donnees/.

--

--

ICTC-CTIC
ICTC-CTIC

Information and Communications Technology Council (ICTC) - Conseil des technologies de l’information et des communications (CTIC)