Module 2: le progiciel de partage de données Commun Axiom

CRIEM CIRM
PDS | DSH
Published in
5 min readNov 18, 2021

Écrit par l’équipe de coordination du PDS* en collaboration avec Luc Véronneau, architecte de solutions

An English version of this post was published here.

Ce billet est le deuxième d’une courte série présentant chacune des trois composantes de la solution proposée par le Centre de recherches interdisciplinaires en études montréalaises (CRIEM) aux partenaires du Pôle d’analyse de données sociales (PDS), soit Centraide du Grand Montréal, la Direction régionale de santé publique de Montréal, le Service de la diversité et de l’inclusion sociale de la Ville de Montréal et Montréal — Métropole en santé. Ces différentes composantes abordent les défis liés à la concertation des acteur·rice·s, à l’identification et à la production de jeux de données, ainsi qu’aux types d’analyse et aux moyens de partage de données qui se doivent de respecter les principes de la protection de la vie privée. Les billets qui leur sont consacrés exposeront les moyens que nous entendons expérimenter en vue d’atteindre les objectifs de la communauté du PDS; ils présentent un état particulier du projet et de la solution, voués à évoluer. Vous êtes invité·e·s à faire partie de la discussion, à nous faire part de vos réflexions et commentaires, et à nous contacter si vous souhaitez être impliqué·e·s dans ce processus qui se déploiera jusqu’en 2025. Lire le billet précédent.

Les objectifs de mutualisation de données du Pôle d’analyse de données sociales (PDS) reposent sur la création d’une plateforme de partage multifonctions: le progiciel Commun Axiom. Celui-ci répond aux besoins des partenaires en matière d’indexation, de transformation, d’échange et d’aide à la gouvernance de données afin de fournir une meilleure compréhension des populations montréalaises.

Lignes directrices pour la mutualisation de données

Le comité des partenaires du PDS se réunit sur une base mensuelle depuis le printemps 2020 pour coconstruire les paramètres de la solution technologique proposée. Les échanges entre représentant·e·s des secteurs universitaire, public et parapublic ont fait ressortir des exigences relatives aux quatre enjeux fondamentaux suivants:

  • sécurité — nettoyage automatique des données fournies par les organismes selon un processus d’extraction, de transformation et de chargement (processus ETC; en anglais: extract, transform, load process ou ETL) réalisé localement;
  • indexation — répertoire des jeux de données disponibles à partir duquel soumettre des demandes d’accès et susciter des collaborations autour d’intérêts communs;
  • propriété intellectuelle et mesure d’impact — possibilité de consulter un historique complet de l’origine et de l’utilisation de chaque jeu de données partagé sur la plateforme;
  • infrastructure légère — hébergement sur un nano-ordinateur Raspberry Pi dont le fonctionnement nécessite de faibles coûts et une consommation d’énergie réduite.

À partir de ces lignes directrices, le progiciel Commun Axiom propose trois applications principales: Ententes; Partages; Grand Livre.

Commun Axiom: Étape 1.1 Membre A demande l’accès au jeu de données à accès restreint > 1.2. Négociations > 1.3. Ententes > 2.1. Conclusion > [2.1.1. Écriture > Grand Livre > 3.1. Autorisation > Groupe Partenaires > Limited Commons License (LCL) > Attribution ] ET [2.1.2. Spécification > Transfère > Partages > Génère] > 3.1. Jeu de données transformées compatible avec la license LCL > 3.2. Téléchargement et stockage > 3.3. Partages > 3.4. Membre B accède aux données
Écosystème global et processus du progiciel Commun Axiom. (Source: Luc Véronneau)

Ententes: établir les conditions du partage

La nature sensible de certaines données complique leur diffusion et leur accessibilité. L’application Ententes permet aux utilisateur·rice·s qui les détiennent ou les reçoivent de négocier les critères d’anonymisation et de sécurité correspondants. Il s’agit d’établir les transformations à effectuer avant tout partage d’un jeu de données, comme le remplacement de codes postaux précis par des zones géographiques élargies ou la permutation des dates de naissance entre plusieurs individus.

L’ensemble de ces conditions ou « métacontraintes » forme un protocole final d’entente pouvant être signé numériquement. La signature du protocole génère une entrée au Grand Livre (ci-dessous) afin de sceller l’entente et d’officialiser le partage entre les parties émettrices et réceptrices.

Partages: au cœur de la mutualisation de données

Comme son nom l’indique, l’application native Partages offre les outils sécurisés nécessaires au transfert de données entre utilisateur·rice·s. Elle permet leur prétraitement automatique en fonction des critères fixés par le protocole d’entente. De cette façon, les propriétaires des données s’assurent que le processus ETC a lieu en amont de l’envoi. Celui-ci s’effectue au moyen d’un chiffrement de bout en bout (end-to-end encryption) asymétrique pour empêcher la lecture par un tiers.

L’application Partages comprend un portfolio qui répertorie et décrit les jeux de données disponibles afin de faciliter la recherche et la découverte. Les requêtes d’accès des utilisateur·rice·s sont relayées par l’orchestrateur aux propriétaires; inversement, des notifications sont émises pour tout nouveau jeu de données rendu disponible. Après le téléchargement, une fonction d’entreposage local conserve les versions transformées des données au sein d’un espace chiffré.

Grand Livre: retracer les données au fil des échanges

L’application Grand Livre s’appuie sur la technologie de la chaîne de blocs (blockchain) dans le but d’archiver l’ensemble des transactions effectuées dans Commun Axiom. Elle permet notamment d’enregistrer la publication de jeux de données et la signature d’ententes entre utilisateur·rice·s.

Elle assure aussi la traçabilité des auteur·rice·s et propriétaires courant·e·s des jeux de données, et ce, même après divers croisements et combinaisons. Il en résulte deux avantages en matière de propriété intellectuelle et de mesure d’impact: 1) citer et reconnaître le travail des organismes émetteurs de données; 2) permettre à ces derniers d’identifier les utilisateur·rice·s et la portée du contenu qu’ils rendent disponible.

Prochaines étapes dans le développement de Commun Axiom

L’équipe responsable de l’infrastructure technologique travaille actuellement à mettre en œuvre la structure de mutualisation des données. On vise à ce que l’application Partages soit fonctionnelle, sans être complète, d’ici la fin de l’année 2021. Il sera alors possible de tester les outils de transfert et de transformation des données en version prototype. Les développeur·se·s expérimenteront ensuite avec le reste des fonctions, y compris la gestion des métacontraintes via la création de l’application Ententes.

À moyen terme, on souhaite décentraliser l’hébergement de l’infrastructure de partage de données qui constitue la plus lourde portion de la plateforme. Nos équipes feront appel à des organismes volontaires ayant suffisamment de ressources dans leurs serveurs pour mettre de côté l’équivalent d’un poste de travail qui servira de relais dans les transferts de jeux de données. La maintenance des comptes utilisateurs, de l’authentification et des autorisations demeurera centralisée au sein d’une application monolithe autonome.

Le progiciel Commun Axiom est une idée originale de Luc Véronneau (Véronneau Techno. Conseil inc) rendue possible par l’équipe de l’infrastructure technologique et du développement du PDS. Celle-ci est actuellement composée de Luc Véronneau (architecte de solutions), Mohammad Moshawrab, Arina Vincter et Ada Yetis (développeur·se·s).

*Rédaction: Julie Levasseur; révision du contenu: Karolyne Arseneault et Luc Véronneau

Le Pôle d’analyse de données sociales est un projet de Montréal en commun, une communauté de projets d’innovation dans le cadre du Défi des villes intelligentes.

--

--

CRIEM CIRM
PDS | DSH

Centre de recherches interdisciplinaires en études montréalaises | Centre for interdisciplinary research on Montreal