La politique d’ouverture des données, codes sources et algorithmes de l’État : quelle place pour la société civile ?

datactivist
Datactivist
Published in
11 min readJan 3, 2022

Écrit par Clément Mandron

Trois mois après la publication, le 27 septembre 2021, des feuilles de route ministérielles des données, des algorithmes et des codes sources, ce billet propose une première synthèse de la politique de l’État en la matière. Cette politique peut paraître illisible. Les 15 feuilles de route et 500 actions décrites en 594 093 caractères soit environ 16h de lecture le rappellent. Si ce billet propose des outils pour suivre ces actions, il rappelle surtout à l’État d’impliquer la société civile pour co-construire sa politique d’ouverture.

La publication des feuilles de routes est une étape importante dans le renouvellement de la politique open data de l’État

La publication des feuilles de route est le fruit d’une volonté politique renouvelée et portée par le Premier ministre qui s’est vu remettre le 23 décembre 2020 le rapport de la mission parlementaire présidée par Eric Bothorel. Ce rapport dresse un état des lieux de la politique de la donnée, des algorithmes et des codes sources en France. Il rappelle les enjeux économiques, scientifiques et démocratiques à relancer une politique d’ouverture.

Notre pays a besoin de plus d’ouverture — sous toutes ses formes : ouverture des données publiques (open data), mais aussi partage et accès sécurisé aux données sensibles”. (Rapport Bothorel, Pour une politique publique de la donnée, 2020)

Lors du 5e comité de la transformation publique (CITP) en février 2021, le gouvernement accélère en chargeant chaque ministère de “décliner une feuille de route ambitieuse en matière de valorisation des données”. La circulaire d’avril 2021 officialise l’ambition renouvelée “en matière d’exploitation, d’ouverture et de circulation des données, des algorithmes et des codes sources” et demande la nomination d’un administrateur ministériel des données, codes sources et algorithmes (AMDAC) pour chacun des 15 ministères, ainsi que des référents dans les préfectures de régions.

Les feuilles de routes sont disponibles sur le site data.gouv.fr, en plus d’autres jeux de données relatifs au suivi de la politique de l’État :

Repères chronologiques des moments clés

Datactivist met à disposition plusieurs outils pour suivre et analyser les feuilles de route

La publication de la liste des 500 actions en open data permet, en théorie, un suivi de leur mise en œuvre. Dans cette perspective, nous avons voulu mettre en place des outils à la fois d’analyse mais aussi de suivi de la politique de l’État concernant les données, algorithmes et codes sources et leur ouverture.

Sur la base du jeu de données des 500 actions, nous avons créé une base Airtable composée de différentes tables et vues. Il possible de paramétrer les différentes tables de la base (pour la méthode, voir le sujet sur #TeamOpenData).

Liste des tables partagées et accessibles à tous du Airtable

Cette base répond à plusieurs objectifs :

  1. décrire les actions pour les comprendre. En effet, la brève description en une ligne d’une action ne suffit que rarement pour pouvoir la comprendre. Nous avons donc ajouté une description plus complète, tirée du contenu de la feuille de route, pour chaque action. La tâche n’était pas aisée car 6 feuilles de route ont du être océrisées pour pouvoir copier leur contenu. Cette situation est étonnante alors que l’article 3 de la loi pour une République numérique prévoit l’utilisation de formats lisibles par les machines. Nous avons partagé les nouveaux PDF océrisés en ressources communautaires, tout comme l’export CSV des actions enrichies de leur description ;
  2. appréhender les actions de chaque ministère pour chaque thématique. La base permet à chacun de filtrer le contenu à travers ses différentes tables et vues. Il est possible par exemple de voir toutes les actions d’ouverture de données qui arrivent à échéance fin 2021 avec leur description précise ;
  3. analyser les feuilles de routes via une grille de critères pour comprendre les visions derrières les actions et faire ressortir des éléments transversaux. On trouve également des informations sur l’AMDAC.

Ces ressources sont mises à disposition de quiconque souhaite s’en emparer. Pour en savoir plus sur la construction de la base et ses utilisations possibles nous avons rédigé dans un sujet sur le forum #TeamOpenData.

Exemple de la table “1. Action” de la base Airtable : toutes les actions enrichies de leur description

Une stratégie se dessine : “sensibiliser, ouvrir, partager et exploiter”

Important : si les feuilles de route ont toutes été lues dans leur intégralité, les éléments ci-dessous ne visent pas l’exhaustivité dans leur analyse.

La lecture des 15 feuilles de route a suscité plusieurs points d’étonnement qui peuvent constituer une première synthèse de la politique de l’État des données, des algorithmes et des codes sources. Même s’il prend en compte les codes sources et les algorithmes, ce billet reste concentré sur l’ouverture des données et le pilotage des feuilles de route.

Afin de poser quelques jalons dans le suivi des actions des feuilles de route, des analyses quantitatives sont nécessaires — en plus des datavisualisation faites par les deux agents d’Etalab en tant que réutilisations du jeu de données des actions.

Accédez au nombre d’actions en survolant le graphique

Le graphique ci-dessus permet de voir, par exemple, que la majorité des actions d’ouverture de données sont à échéance en 2022 alors que les actions de gouvernance étaient attendues en majorité dès la fin d’année 2021. C’est également au S1 2022 que se concentrent de nombreuses actions d’acculturation et de formation.

On peut également se concentrer sur les trois thématiques les plus importantes en termes de nombre d’actions : l’ouverture des données, le partage des données (API) et leur exploitation. Les actions d’ouverture de données — même si elles restent plus nombreuses sur toutes les échéances — sont proportionnellement plus nombreuses au S1 2022 alors que le “pic” d’actions de partage (API) et d’exploitation des données se situe au S2 2022.

Schématiquement, on pourrait comprendre la stratégie générale de la manière suivante : sensibiliser et mettre en place une gouvernance, ouvrir, partager entre acteurs habilités et enfin exploiter.

Au-delà d’une base commune, les multiples visions des feuilles de route mettent en lumières des cadres d’action différents

Tout d’abord, les feuilles de route suivent pour la plupart un plan assez standard : d’abord les enjeux et les objectifs, puis les actions sur l’ouverture, l’exploitation et le partage des données, ensuite la formation et l’acculturation et enfin la gouvernance et le pilotage de la feuille de route. Ces points communs semblent logiques car la politique est interministérielle et s’inscrit donc dans un cadre commun aux différents ministères. Certaines thématiques sont de ce fait très standardisées et ne permettent pas d’apprécier la maturité des ministères sur ces sujets.

Ensuite, les cadres de référence des feuilles de routes peuvent différer. Si toutes — ou presque — ont évoqué des bases communes à leur vision (circulaire du 27 avril 2021, rapport Bothorel, loi pour une République numérique de 2016), certaines feuilles de routes se démarquent avec des cultures fortes. D’abord le Partenariat pour un gouvernement ouvert (PGO) est régulièrement cité comme cadre d’action. Ensuite, certains ministères évoquent le cadre européen (par exemple le Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation ou encore le Ministère de la Transition Écologique, notamment dans le cadre des obligations réglementaires INSPIRE). La stratégie interministérielle, elle, n’est pas systématiquement mise en avant même si certains ministères le font. Par exemple, le Ministère de l’Économie souligne fortement ce point dans sa vision, notamment les outils mis à disposition par la DINUM.

Beaucoup de ministères placent cette feuille de route dans le cadre de stratégies déjà existantes sur des sujets connexes (plan de transformation de l’État, numérisation, stratégie de données et intelligence artificielle). C’est également le cas pour les actions dont un nombre significatif reprend des décisions déjà existantes ou des projets engagés. Néanmoins, peu de ministères mentionnent précisément les principes fondamentaux de la loi de 2016 — avec en tout premier lieu l’ouverture par défaut des données publiques. C’est également le cas des recommandations et inspirations du rapport Bothorel qui sont peu reprises (ouverture par défaut des données publiques, questions des données d’intérêt général détenues par les acteurs privés).

La co-construction et la mise en œuvre collective ne sont pas au cœur des feuilles de route

La co-construction est pourtant un des principaux facteurs de réussite d’une politique d’ouverture des données et notamment de leur mise en qualité.

D’abord en interne, si l’implication des différentes directions productrices et utilisatrices de données est bien visible dans la construction de certaines feuilles de route, elle n’est pas systématique. De plus, seulement une minorité en précise les modalités d‘évolution. Deux exemples parmi d’autres semblent intéressants, bien qu’ils ne concernent pas des actions en tant que telles :

  • Le Ministère de la Cohésion des Territoires et des relations avec les collectivités territoriales rappelle que la feuille de route sera mise en concertation, notamment avec les associations d’élus et les collectivités territoriales (page 10) ;
  • Le Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation pose comme principe que la feuille de route soit “centré[e] sur les attentes et la participation des usagers dans son élaboration et son évolution” (page 30).

Les (ré)utilisateurs sont souvent inclus dans les actions mais les ministères ne mobilisent pas tous leur communauté avec la même intensité. Des actions vont néanmoins dans ce sens. Par exemple, l’animation de réseaux thématiques identifiés par le Ministère de la Transformation et le Fonction publique ou encore l’organisation d’événements dans le cadre du groupe de travail “Réutilisation des données” du Ministère de la Justice incluent les réutilisateurs des données.

La gouvernance des feuilles de routes est relativement similaire suivant les ministères. La plus grande différence est la direction à laquelle est rattachée l’AMDAC. Cependant, peu indiquent vouloir y associer très fortement les utilisateurs. Même constat pour le pilotage des feuilles de route. Mis à part le Ministère de la Santé et des Solidarités, qui propose un comité consultatif de pilotage composé, entre autres, de représentants de la société civile, on ne retrouve pas d’autres actions qui vont dans ce sens.

L’ouverture des données est un thème prioritaire mais dont le cadre d’action décrit n’est pas toujours très clair

Ce thème est très présent dans les feuilles de routes qui montrent bien le respect et la cohérence avec la circulaire d’avril 2021 (la majorité relative des actions concerne cette thématique).

La meilleure qualité et accessibilité des données est une condition indispensable pour une politique renouvelée d’open data. Si beaucoup d’actions encourageantes (label qualité, qualité par défaut avant l’ouverture, etc) vont dans ce sens, leur place dans les feuilles de route semble en décalage avec celle qu’elle occupe dans le rapport Bothorel. La synthèse de ce rapport lui consacre toute une partie. En effet, pour “changer d’ère, l’open data doit viser une plus grande fiabilité par la documentation, […] des métadonnées plus homogènes, entre autres”. Ici, c’est notamment les moyens qui manquent. Les métadonnées sont peu évoquées dans les feuilles de routes, de même que la documentation des jeux de données. Il est difficile de distinguer comment précisément les administrations comptent s’y prendre pour réaliser les engagements de qualité.

Certaines feuilles de route reprennent le principe d’intégrer les usagers dès le début du processus d’ouverture des données pour améliorer justement la qualité (guichet de demande d’ouverture, événement avec les réutilisateurs, etc…). Que ce soit dans un plan d’ouverture précis ou sur la base d’une liste de données à ouvrir, trop de ministères gardent le réflexe d’établir des critères internes de sélection d’ouverture, sans impliquer le plus tôt possible les utilisateurs. Le travail de catalogage des données (la quasi-totalité des ministères proposent une action de ce type) semble être engagé. Néanmoins, les actions concrètes détaillant les moyens de l’intégration des utilisateurs tôt dans le processus d’ouverture ne sont pas la norme. Des méthodes pourtant existent (non-conférence des données ouvertes de Bercy, ateliers de co-construction avec les utilisateurs du MCT, forums Open d’État, etc…). De plus, l’ouverture par défaut contribue à encourager les réutilisations. Comme le rappelle le rapport Bothorel : “il n’est pas possible de connaître par avance les réutilisations qui seront faites de données et de codes, et par conséquent de préjuger totalement de l’utilité d’une ouverture”.

Le suivi des ouvertures, un défi pour la société civile

Il existe de très nombreuses actions (portées par plusieurs ministères différents) de catalogage et inventaire des données détenues, de calendrier d’ouverture, de tableaux de bords de suivi des ouvertures, etc…. Mais il est difficile de mettre en place un suivi clair de ces actions pour les futurs utilisateurs des jeux en open data. Le tableau interministériel de suivi des ouvertures semble ne pas contenir toutes les ouvertures prévues dans les feuilles de route mais seulement celles de sa première publication. Pourtant, il pourrait jouer un rôle clé dans la facilitation entre utilisateurs et les ministères qui se sont engagés sur des données, API, codes sources ou algorithmes à ouvrir.

Enfin, les hubs et les systèmes de partage de données entre l’administration et/ou les acteurs privés rencontrent un très grand succès. Cette thématique rejoint également le développement des API (plusieurs actions d’”API First”) et de la démarche “dites-le nous une fois” qui est reprise dans toutes les feuilles de route. Ces actions sont en partie très encourageantes, car elles mettent souvent en avant la participation et l’animation de la communauté dans la démarche. Néanmoins, les critères de choix entre partage et ouverture des données ne sont pas toujours précis et peuvent laisser entendre une préférence du partage sur l’ouverture.

Les données d’intérêt général sont également évoquées par quelques feuilles de routes mais peu proposent un cadre fort vers l’ouverture de ces données.

Beaucoup d’autres thématiques sont abordées dans les feuilles de route (codes sources, algorithmes, acculturation, moyens, formations, etc) mais le choix a été fait dans ce billet de concentrer l’analyse sur la gouvernance et l’ouverture des données.

Les feuilles de route laissent peu de place à l’implication des communautés

La politique des données, des algorithmes et des codes sources de l’État est dotée d’une gouvernance interministérielle. Elle est pilotée par la DINUM via son AGDAC qui préside le Comité Interministériel de l’Administration de la Donnée (CIAD). La DINUM place au centre du suivi d’ouvertures des données, des algorithmes et des codes sources le tableau de suivi déjà évoqué plus haut.

Les communautés utilisatrices des données, algorithmes et codes sources publics ont tout intérêt à pourvoir suivre et être impliquées dans la mise en œuvre des feuilles de route. Cela reste particulièrement compliqué. Les actions et thématiques abordées dans ces feuilles de route sont denses et nombreuses. Il est difficile d’en faire une synthèse ou même un bilan. Pour rappel, les seules descriptions des actions tirées du contenu des feuilles de route font 594 093 caractères soit environ 16h de lecture.

C’est pourquoi, les ressources décrites dans ce billet sont des outils qui appellent les citoyens et les associations à s’en emparer pour assurer un suivi des feuilles de routes, et donc contribuer au contrôle de la politique de l’État.

Cette forme d’action publique, c’est-à-dire la construction de feuilles de route dans un fort cadre interministériel, pose des difficultés. Le temps très limité d’élaboration des feuilles de route laisse peu de place à l’implication des communautés. On retrouve des difficultés similaires sur le plan d’action pour un Gouvernement Ouvert (voir notamment la position de Transparency France) et sur la feuille de route “Numérique et environnement” publiée en février 2021.

Les actions pour inclure a posteriori ces communautés ne sont pas la norme et celles présentées demandent à faire leur preuve. Au-delà du suivi des feuilles de route par les usagers et la société civile, c’est donc à l’État de favoriser leur implication à travers sa politique.

--

--