5 jours pour initier la démarche open data de 19 collectivités

Arthur Sarazin
Datactivist
Published in
12 min readMay 20, 2021

Retour sur la troisième édition du Challenge Data

Par Julia Dumont, Allyson Pallisser, Arthur Sarazin et Diane Thierry.

Du 15 au 19 février 2021, 120 étudiant.e.s de Sciences Po Saint-Germain-en-Laye ont ouvert 76 jeux de données pour le compte de 19 collectivités. Ce résultat est le fruit d’une semaine de travail intense au cours de laquelle ils ont mis leurs connaissances et leur énergie au service de l’intérêt général dans le cadre du Challenge Data.

Pour cette troisième édition, l’événement a fait peau neuve. Au croisement des données et de l’action publique, le rendez-vous annuel de la data à Sciences Po Saint-Germain-en-Laye s’est doté d’une nouvelle feuille de route et d’un nouvel objectif : initier la démarche open data « des 90 % », qui représentent les collectivités qui n’ont pas pu ouvrir leurs données comme la Loi Lemaire les y oblige.

Partant de ce constat, cette édition est allée à la rencontre d’un échantillon de ces 90 %. Grâce à la force vive des étudiant.e.s de Sciences Po et au financement de l’Agence Nationale de la Cohésion des Territoires, 19 collectivités ont mis en place un processus d’ouverture de données et ont pu, avec succès, publier leurs premiers fichiers sur le portail national data.gouv.fr. Un projet inédit pour ces collectivités (par souci de lisibilité, nous désignons par collectivités les communes et EPCI accompagnés, bien qu’une intercommunalité ne soit pas une collectivité territoriale).

Pensé pour être un moteur d’impulsion à l’ouverture des données en France, le Challenge Data #3 a tenu toutes ses promesses :

Ces chiffres enthousiastes sont issus d’un travail intense de documentation et de cadrage méthodologique. Pour la première fois, l’événement s’est appuyé sur la méthodologie développée dans le cadre de l’Open Data Canvas.

Les collectivités participantes incarnent la diversité des profils au sein de ces 90% : des toutes petites communes jusqu’aux grandes métropoles en passant par les Établissements Publics de Coopération Intercommunale (EPCI), même avec un défi unique, l’événement a su s’adapter à des contextes et des enjeux divers :

Découvrez les collectivités participantes : ici

Un challenge pour pallier au manque de moyens des collectivités

Organisé par Datactivist depuis février 2019, le Challenge Data est l’occasion pour les étudiants de Sciences-Po Saint-Germain-en-Laye de faire face aux problématiques du travail d’ouverture et d’utilisation des données ouvertes.

La nouvelle édition de l’événement a été pensée pour encourager l’open data dans l’hexagone où, selon l’Observatoire Open Data des Territoires de l’association Open Data France, 90% des collectivités concernées par la loi pour une République numérique ne publient toujours pas leurs données.

Ce chiffre, encore loin des objectifs fixés par la Loi pour une République Numérique, est à l’origine de cette nouvelle édition du Challenge. Les partenaires de l’événement sont convaincus que le passage à l’échelle en matière d’open data peut être accéléré grâce à des événements courts et intenses, qui stimulent (et parfois bousculent) les collectivités.

Aussi ont-ils été convaincus par la nécessité d’équiper les collectivités dans ce passage à l’échelle. La volonté politique eu égard à l’ouverture des données est une chose, certes nécessaire dans ce passage à l’échelle, mais pas suffisante. Il est indispensable de la coupler avec une mise en capacité des agents des collectivités ; de combler leurs manques de ressources, de connaissances et de temps et aussi de confiance en eux pour leur permettre d’activer l’engrenage de l’open data. Les étudiants ont œuvré en ce sens.

Guidés par une méthodologie issue de la thèse d’Arthur Sarazin et de l’expérience des membres de la communauté open data, les étudiant·e·s ont pu effectuer 18 tâches nécessaires au travail d’ouverture et d’utilisation des données. La réalisation de chacune d’entre elles a été documentée, les expériences vécues inscrites dans des carnets de bord de manière à ce que toutes les collectivités puissent anticiper les freins à l’ouverture et trouver des solutions adéquates.

Une méthodologie par étape

Chaque collectivité participante a été accompagnée par un groupe de 6 à 7 étudiants de 4e année de Sciences Po Saint-Germain-en-Laye en continu sur la semaine du Challenge Data. Les équipes d’étudiants regroupaient différentes compétences en mixant des étudiants venant de 4 spécialités différentes : Droit et Action publique, Europe et International, Culture et communication, Management, économie et finances. Des rencontres virtuelles étaient organisées quotidiennement entre les étudiants et leurs interlocuteurs au sein des collectivités pour suivre le déroulé et en même temps acclimater les agents aux étapes de l’ouverture des données.

Illustration du parcours méthodologique suivi par les étudiant.e.s lors de la semaine du Challenge Data | Illustration par Anne-Cécile Calléjon

Etape 1 — Diagnostic

Le Lundi, les étudiants sont entrés en contact avec la collectivité qu’ils accompagnaient et ont utilisé un questionnaire pour évaluer sa maturité open data . Cette étape leur a permis d’orienter ensuite la collectivité vers des jeux de données plus ou moins faciles à ouvrir au sein d’un catalogue de données. Ce recueil d’une trentaine de jeux de données comporte les indispensables de l’open data territorial, des jeux de données utiles pour la collectivité et pour la communauté. Le catalogue peut être parcouru et filtré par niveau de difficulté d’ouverture mais aussi par thématique afin de prendre en compte les envies et les besoins d’ouverture de chacun. A l’issue de ce lèche-vitrine, une wishlist de données était rédigée. Aidée par son groupe d’étudiants, chaque collectivité y hiérarchisait les jeux de données qu’elle souhaitait ouvrir.

Etape 2 — Identification

Il y a ce que l’on souhaite publier et ce que l’on peut publier. C’est pourquoi le Mardi, la wishlist en main, les étudiants sont partis à la recherche des données dans les différents services de la collectivité. Ils ont complété un organigramme conçu comme un premier pas de cartographie des données puis ils ont évalué chaque jeu de données récupéré dans le but d’estimer la charge de travail à lui consacrer en vue d’une possible publication. A la fin de la journée et dans un dialogue continu avec la collectivité, la wishlist s’était réduite à une wanted data list, la liste des jeux de données que les étudiants s’engageaient à publier pour la collectivité.

Etape 3 — Mise en qualité

Le Mercredi (de loin la journée la plus difficile), les étudiants ont suivi toutes les étapes de mise en qualité des données de la collectivité. Ils se sont appliqués à transformer les données récupérées au sein des collectivités pour les rapprocher le plus possible des standards de publication qui rendent les jeux de données utiles et utilisés. A la fin de la journée, les fichiers retravaillés ont subi une double vérification : celle d’un validateur d’abord (pour vérifier la conformité avec les standards), et enfin celle de la collectivité avant publication.

Etape 4 — Publication

Après tous ces efforts, vient le temps d’une étape particulièrement satisfaisante : la publication des données. Le jeudi, les étudiants ont d’abord créé des comptes pour les collectivités sur data.gouv.fr lorsqu’elles n’en avaient pas déjà. Ensuite, ils ont publié les jeux de données préparés et validés en complétant tous les éléments d’informations et en ajoutant toute la documentation nécessaire à leur bonne prise en main par les réutilisateurs. Dans le même temps, ils ont préparé la communication de la collectivité autour de la publication de ces données afin que celles-ci trouvent leur public.

Etape 5 — Valorisation des données

Pour montrer aux étudiants et aux collectivités quelques uns des bénéfices de l’open data, il était important de leur faire travailler cette matière première. C’est pourquoi, le vendredi a été consacré à la réalisation de datavisualisations à partir des données publiées. Celles-ci ont ainsi pris du sens en devenant informations, en devenant arguments de discours, éléments de communication ou encore preuve d’action politique… Toutes les représentations graphiques des étudiants ont été également publiées sur data.gouv.fr en tant que réutilisations de données.

En une semaine, les étudiants sont donc passés par les étapes essentielles d’un projet d’ouverture des données et ont été immergés dans les problématiques concrètes des collectivités territoriales qu’ils ont accompagnées. Le Challenge Data a été pensé pour eux comme une véritable expérience professionnelle, riche en enseignements qui pourront être mis à profit pendant les études mais aussi post diplôme.

A l’issue du challenge, les collectivités participantes quant à elles se sont vues remettre la méthodologie pas-à-pas utilisée et améliorée suite à l’expérience du Challenge Data. Enrichies par l’événement, le pied mis à l’étrier par les étudiants et outillées par la méthodologie fournie, elles peuvent désormais capitaliser sur les avancées de la semaine et gagner en autonomie dans le processus d’ouverture de leurs données.

Outiller les collectivités qui se lancent dans l’open data

Toute méthodologie et la documentation de sa mise en œuvre, ont permis d’alimenter un framework national de l’open data : l’Open Data Canvas. Les étudiant.e.s ont en effet participé à la création de contenus qui ont été combinés et cousus entre eux de manière à créer un parcours d’ouverture, et de valorisation des données réplicables à l’échelle nationale et pour toutes les collectivités. Ce parcours est publié et mis à la disposition de tous dans une rubrique dédiée sur le portail de l’Open Data Canvas.

Cette méthodologie disponible en libre accès dans une rubrique dédiée sur l’Open Data Canvas, prend la forme d’un parcours qui répond à 4 critères :

  • Il se compose d’instructions exprimées avec précision et sans ambiguïté ;
  • Ce parcours a toujours une conclusion, quel que soit le contexte dans lequel il se met en place (il ne doit pas se transformer en serpent qui se mord la queue !) ;
  • Il donne toujours une réponse, quelle que soit la question à laquelle la collectivité souhaite répondre à travers l’ouverture et l’usage des données ;
  • Il est le plus efficace possible.

Les 18 opérations concrètes qui composent ce parcours permettent de collecter, de mettre en qualité, d’ouvrir et de visualiser les données de la collectivité. Pour chacune d’entre elles, les étudiants ont pu s’appuyer sur un ensemble de 4 éléments didactiques conçu pour favoriser le passage à l’action et la manipulation concrète des données :

  • Un ou des outils de manipulation de données en libre accès
  • Un tutoriel vidéo pour accompagner la prise en main des outils
  • Un pas-à-pas détaillé des actions à effectuer avec ces outils.
  • Des exemples concrets issus des documents réalisés pendant le challenge

Ces 4 éléments sont accessibles depuis une seule et unique page correspondant à l’étape du parcours en cours de réalisation :

Pour avoir un aperçu du contenu mis à disposition, on retrouvera sur la chaîne Youtube de l’Open Data Canvas tous les tutoriels pour accompagner la réalisation des 18 opérations.

A l’évidence, tout travail d’ouverture des données, aussi bien documenté soit-il, rencontre des impasses et les efforts des étudiants n’ont pas échappé à la règle. Pour éviter que cela ne bloque la dynamique nous avons mis à disposition une équipe d’accompagnement composée de cinq consultant.e.s open data : Allyson, Arthur, Guillaume, Julia et Magalie. Ces experte·s en ouverture de données ont été chargés de guider et aider les étudiant.e.s de manière à ce qu’ils puissent sortir des impasses rencontrées. Connectés sur un espace virtuel de la solution Gather.town, les étudiants pouvaient les solliciter à tout moment du challenge.

Image d‘un groupe de travail des étudiant.e.s sur Gather Town

A l’évidence, on apprend à ouvrir les données en regardant d’autres le faire. Et quoi de mieux que de permettre aux étudiants et aux agents des collectivités de voir, en live, les manipulations à entreprendre pour aboutir à des résultats ? Au-delà de la dimension pédagogique, cette permanence a permis de personnifier la démarche pour chaque collectivité.

76 jeux de données ouverts

Bien encadrés par la méthodologie et guidés par leurs coachs, les étudiant.e.s, en collaboration directe avec les agents des collectivités, ont pu ouvrir 76 jeux de données en un temps record. Le processus d’ouverture a fait l’objet d’une validation de la part des agents. Ils ont également mis les mains dans le cambouis et développé des dataviz pour illustrer ces données une fois ouvertes. A la fin de l’événement, des dizaines de datavisualisations ont été élaborées par les étudiants, comme prévu dans la méthodologie.

Ces données nouvellement disponibles vont permettre aux collectivités et à la communauté open data en général de s’en servir et de développer de nouveaux usages, à l’image des jeux de données des marchés publics du Pays de Mormal, des arbres urbains de Saint-Germain-en-Laye et des places de covoiturage de la Plaine d’Estrées, retravaillées par Datactivist.

1er exemple : Marchés publics du Pays de Mormal

Lien vers la visualisation interactive

Ces données représentées graphiquement concernent les marchés publics du Pays de Mormal pour les années 2015, 2016 et 2017. Pour chacune de ces années on retrouve la géolocalisation des entreprises ayant conclu un marché avec cette communauté de communes. On voit alors que la plupart des marchés sont conclus avec des entreprises locales, c’est-à-dire résidentes en Pays de Mormal ou situées non loin du territoire. En 2015, 2016 et 2017, les parts des entreprises contractantes situées en région Hauts-de-France étaient respectivement de 75%, 86% et 93%.

Une démonstration par les données que la communauté de communes du Pays de Mormal redistribue l’argent public en contribuant à l’économie locale.

2ème exemple : Arbres urbains de Saint-Germain-en-Laye

Lien vers la visualisation interactive

Cette deuxième visualisation reprend les informations relatives aux arbres urbains de Saint-Germain-en-Laye. On retrouve pour cette commune l’emplacement de chaque arbre avec ses principales caractéristiques telles que le genre, l’espèce, l’année de plantation et la taille. On voit ainsi la diversité écologique de la flore urbaine de St Germain en Laye, avec près de 40 espèces d’arbres différentes plantées entre 1950 et 2019.

3ème exemple : Places de covoiturage de la Plaine d’Estrées

Lien vers la visualisation interactive

Durant le Challenge Data, certaines collectivités ont interrogé les étudiants sur l’intérêt d’ouvrir des jeux de données comme ceux sur les places de covoiturage ou les points de recharge électriques, lorsque ceux-ci n’allaient contenir que quelques lignes de données. Pour leur répondre, il est nécessaire de changer d’échelle.

Nous pouvons observer sur cette dernière représentation graphique les places de covoiturage de la Plaine d’Estrées, identifiables en rouge sur la carte. Cette communauté de communes regroupe 105 places de covoiturage réunies en 2 communes différentes. L’ouverture de telles données, recoupées avec les informations officielles de Blablacar (en violet), permet de visualiser les différents lieux de stationnement gratuits en France. Pour la collectivité qui ouvre ces données, les avantages résident dans le dynamisme qui peut en découler. En effet, si ces informations sont connues des voyageurs, ils seront plus enclins à s’arrêter sur les aires prévues au covoiturage, à déjeuner dans les commerces voisins et ainsi augmenter les flux et l’attractivité de la région.

Lien vers les visualisation interactives

Quelques leçons d’open data issues de ce Challenge

Sous son nouveau format, le Challenge Data se présente comme une version accélérée du travail d’ouverture normalement entrepris par les collectivités. Les agents et les étudiants ont pu effectuer l’ensemble des tâches qui permettent d’initier une démarche open data : clarification des besoins adressés derrière l’ouverture, identification des jeux de données, qualification, publication et valorisation à travers des visualisations.

Les 5 jours du Challenge se sont finalement révélés comme étant un observatoire miniature des difficultés auxquelles les collectivités se trouvent confrontées au moment de se lancer dans l’ouverture des données, par exemple :

  • Le manque de communication entre les différents services
  • La faible acculturation à la donnée des agents
  • La qualité variable des jeux de données utilisés dans les collectivités

Toutefois, les collectivités qui ont prévenu leurs services et travaillé les données en amont ont connu une semaine de travail plus fluide et légère, démontrant l’importance d’une démarche collective lors d’un projet opendata. Ainsi, l’événement a-t-il été l’occasion de découvrir que les petites collectivités jouissent d’un avantage comparatif par rapport à leurs consoeurs de plus grande taille : leur agilité et réactivité organisationnelle, et ce d’autant plus lorsqu’elles peuvent s’appuyer sur des agents moteurs.

Avec du recul, nous constatons que ce Challenge Data s’est déroulé en deux temps. Le premier a consisté à penser et concevoir le nouveau format et au recrutement des 19 collectivités ; la deuxième à mettre en œuvre ce nouveau format grâce aux étudiant.e.s de Science Po Saint-Germain-En-Laye et au soutien de l’Agence Nationale pour la Cohésion des Territoires.

A l’avenir, nous espérons que ces deux temps seront complétés par un troisième, celui où de nouvelles collectivités s’appuieront sur cette nouvelle démarche, analyseront le chemin parcouru par les 19 collectivités initiales et enfin, ouvriront leurs données pour les rendre utiles et utilisables !

--

--