Archivistes, professionnels de l’open data : nous n’avons pas le même maillot mais nous avons la même passion

Anne-Laure Donzel
Datactivist
Published in
7 min readJun 8, 2020

--

Je rejoins Datactivist après un parcours en collectivités territoriales principalement dans des services archives et sur des projets d’archivage électronique et d’accompagnement de projets de dématérialisation, avant de, naturellement, me diriger vers des questions concernant la gouvernance des données, la protection des données à caractère personnel et de l’accès aux documents administratifs.

Ma pratique archivistique nourrit mon expérience et j’ai choisi pour ce billet de présenter six points communs que je vois entre les archives et l’open data, sur le modèle de ce billet d’Etienne Pichot Damon.

Des objectifs communs

En France, l’organisation des archives en tant que service public est née lors de la Révolution comme un principe démocratique fort, elle est liée à l’article 15 de la Déclaration des droits de l’Homme et du Citoyen de 1789, qui précise que La société a le droit de demander compte à tout agent public de son administration. L’archivistique française repose donc sur la publicité et l’ouverture des archives pour les citoyens, et le décret du 7 messidor an II, à l’origine de la réglementation sur les archives publiques, comportait déjà ce principe. Il connaîtra divers aménagements, des restrictions plus ou moins grandes mais l’idée de la transparence administrative, d’un pouvoir de contrôle exercé par la société civile sur la production administrative est au cœur de la pratique archivistique depuis ses origines.

Déclaration des droits de l’homme et du citoyen, pilonnée par le Mouton national en 1793, Archives Nationales, AE/I/9/3

Mais, malgré une volonté forte et une aspiration à l’accès universel aux archives, il existe des forces contraires et des tentations de repli. Ces questions sont complexes et agitent encore la profession, en témoigne le thème choisi par l’Association des Archivistes Français pour son forum en 2019 “Archives et transparence, une ambition citoyenne”.

La transparence est également une des questions fondamentales de l’Open data. Elle apparaît souvent comme le premier élément plaidant pour l’ouverture des données. Celles-ci permettant d’assurer une plus grande transparence de l’action publique, d’évaluer l’égalité d’accès aux droits, de mesurer des disparités de traitement etc.

Lorsque l’on travaille sur les deux sujets, archives et/ou open data, on doit apprendre à jongler entre plusieurs réglementations qui se recoupent le plus souvent, mais offrent parfois des subtilités difficiles à concilier : Code du Patrimoine, Loi CADA, Loi pour une République Numérique, règlementation sur la protection des données personnelles.

Recenser, identifier

L’archivage repose sur une pratique de tri et de sélection. Il n’est pas question de conserver toute la production d’une organisation indéfiniment. Pour ce faire, il faut posséder une connaissance fine des pratiques et de la production documentaire d’un organisme.

Les archivistes utilisent depuis longtemps des tableaux de tri diffusés par l’administration centrale dont ils dépendent, ils fournissent des indications sur le sort (conservation ou destruction) et la durée de conservation des documents à un niveau assez macro. Pour avoir une vision plus précise et qui correspond mieux à leur contexte d’exercice, les archivistes rédigent souvent des tableaux de gestion.

Exemple de tableau de gestion de la Direction départementale de la cohésion sociale du Vaucluse

Ces référentiels constituent également un outil de dialogue avec les services producteurs : ils permettent de comprendre comment sont constitués les documents et comment ils circulent au sein d’un organisme.

Le lien avec l’open data peut sembler ici moins évident que dans d’autres cas, mais, la plupart des projets débutent par la réalisation d’une cartographie des données d’une organisation. Dans l’approche et dans l’usage, cette cartographie est assez similaire à la pratique du tableau de gestion. Il s’agit d’avoir une vision la plus exhaustive possible des données et/ou des documents ainsi que de bien comprendre comment et qui les produit. Cette étape doit permettre de mener une action dont le but final sera la mise à disposition, dans les meilleures conditions possibles, d’informations.

Contextualiser, documenter

L’archiviste intervient souvent (trop) tard dans l’histoire d’un fonds documentaire. Il n’est pas rare de se trouver face à des documents concernant un service, un organisme, une association, ayant disparu depuis longtemps. L’archiviste va donc devoir reconstituer l’histoire de cet organisme, à la fois pour lui-même, afin de pouvoir classer le fonds mais aussi pour les utilisateurs ultérieurs du fonds, afin qu’ils puissent mieux l’appréhender.

L’archiviste manipule donc beaucoup de données liées au contexte de production d’un fonds et il va les rendre disponibles aux usagers des archives, souvent sous forme de notices descriptives. Le concept de métadonnées est donc bien connu des archivistes et il existe plusieurs schémas de données permettant de les structurer. Par exemple, les schémas xml EAD pour l’encodage des descriptions de fonds d’archives ou EAC-CPF pour l’encodage d’informations relatives aux producteurs de fonds d’archives.

By cea + from The Netherlands — Metadata is a love note to the future, CC BY 2.0, https://commons.wikimedia.org/w/index.php?curid=47522668

La documentation et la standardisation via des schémas de données, sont des enjeux importants de l’open data. La description des jeux de données, permettant de les trouver et de les comprendre, est souvent un aspect négligé du travail sur les données. De nombreux jeux de données sont publiés sans explication sur des points qui sont au cœur de la pratique archivistique : description générale, dates, nom du producteur, contexte de production, présentation de la structure, conditions d’utilisation et d’accès.

Valoriser, communiquer

La conservation d’archives sans un but de mise à disposition n’a pas de sens. Elle peut prendre différentes formes, de la “simple” communication en salle de lecture à de la valorisation plus construite en mettant en place des techniques de médiations.

Que se soit par l’historique des pratiques ou par les nouveaux canaux de diffusion, les archivistes peinent à avoir une connaissance fine de leurs usagers et de leurs besoins. Les sites internet proposent le plus souvent des contenus limités (Etat-civil, registres matricules, recensement de populations) et répondant essentiellement à la demande d’un public de généalogistes. Pourtant, les archives conservent bien d’autres documents qui pourraient répondre à des besoins, certes sans doute moins répandus, mais qui existent. Ce travail sur un retour usager et la recherche de nouveaux publics est un chantier à mener.

Ce changement d’approche est assez similaire aux réflexions en cours au sein du monde de l’open data sur un passage d’une stratégie de l’offre à une stratégie de la demande. Dans les deux cas, open data et archives, il est inimaginable de tout mettre à disposition. Cela nécessiterait du temps et des investissements qui n’ont pas d’intérêt. Il faut donc mieux réfléchir en termes d’usages et de besoins en allant à la rencontre des communautés.

By Archives nationales (France) — Own work , CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=29166386

Par ailleurs, sur les aspects de communication, il est intéressant de voir que dans les deux cas, les principaux utilisateurs sont souvent les services eux-mêmes.

Sensibiliser, expliquer

Contrairement à une idée reçue, trier, classer, organiser, sélectionner, documenter, indexer, ne sont pas des compétences innées, cela s’apprend et se développe. L’archiviste, dans tous le panel de ses missions, consacre beaucoup de temps à expliquer et sensibiliser ceux avec qui il travaille aux enjeux de l’archivage, à l’importance de cette tâche et aux différentes facettes de son action.

L’archivage est rarement une mission valorisée au sein des organisations, elle est trop souvent cantonnée à une action de sauvetage quand il n’y a plus de place dans les bureaux.

Dans sa thèse, Samuel Goëta met parfaitement en lumière le travail invisible sur les données pour les services à l’origine de leur production. Les archivistes et les chargés de mission open data se trouvent dans la même situation : ils doivent mener une action (qui repose sur une obligation réglementaire dans les deux cas) en étant tributaires du travail d’autrui. Il faut donc, dans les deux cas, expliquer, sensibiliser, persuader, convaincre, adapter son discours à son auditoire afin d’arriver à leurs fins, qui sont un bien commun.

Accéder, réutiliser

Enfin, l’archivage et l’open data partagent également le fait d’être des pratiques dont le but final est la mise à disposition d’une ressource dont toute personne peut se saisir et utiliser. L’accès aux archives a longtemps été limité par des questions matérielles : il fallait se déplacer dans un service d’archives pour avoir accès aux documents. L’essor du numérique a permis la diffusion de contenu en ligne.

Les deux pratiques partagent les mêmes problèmes :

  • une multiplicité de point d’accès
  • un manque d’homogénéité des contenus diffusés sur les sites
  • une difficulté à découvrir où se cache l’information recherchée. Pour l’open data, Samuel Goëta évoque souvent les difficulté de “découvrabilité” des jeux de données. Ce terme pourrait être appliqué aux archives. Les portails d’archives possèdent tous des ergonomies différentes et une sémantique particulière. Il est parfois difficile, même pour une professionnelle de s’y retrouver.
By Auregann — Own work, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=19833263

Pour la rédaction de ce billet, j’ai délibérément choisi de voir les points de convergence entre archivage et open data. Certains aspects sont plus complexes et mériteraient d’être analysés plus finement. Mais je pense que les liens entre les deux pratiques sont nombreux et devraient être développés, j’aimerais pouvoir amener les archivistes à mieux répondre aux obligations en matière d’open data et favoriser leur implication dans les projets de gouvernance des données et, d’autre part, amener les praticiens de l’open data à mieux connaître et s’inspirer des pratiques des archivistes.

--

--