La lecture stimulante du billet de Gautier Poupeau, « La conservation des données numériques n’est ni une révolution, ni inatteignable »(http://www.lespetitescases.net/la-conservation-des-donnees-numeriques-n-est-ni-une-revolution-ni-inatteignable) a ravivé chez moi l’envie de réagir face au défaitisme ambiant de certains archivistes…aussi sans doute pour (re) affirmer qu’il ne s’agit pas d’une posture des archivistes en général et que nous sommes nombreux, à tous les échelons du territoire et quel que soit notre contexte de travail, à expérimenter des dispositifs d’archivage électronique qui, s’ils n’ont pas l’ambition des projets d’envergure nationale portés par la BNF avec SPAR ou l’Etat avec Vitam, contribuent à faire avancer la réflexion avec des réalisations concrètes.

Mes propos sont à lire en écho (et non pas en réponse) à ceux de Gautier Poupeau ; j’y reprends et développe certains de ses arguments et en avance d’autres….

Je crois sincèrement, également pour l’avoir expérimenté à titre personnel, que les archivistes ont tous les outils intellectuels en main pour aborder sereinement la question de l’archivage électronique. Car avant d’être une problématique technique, celle des supports et des formats, la conservation des écrits électroniques renvoie précisément aux enjeux d’authenticité et de fiabilité de l’information et à la mobilisation des concepts de la Diplomatique.

L’archivage électronique peut sembler une révolution pour le métier d’archiviste car l’environnement numérique interroge fortement l’actualité du concept d’archives tel que défini dans le Code du patrimoine, notamment dans la sphère publique ainsi que le principe d’une collecte territorialisée. Malgré un cadre juridique clair et explicite, il y a en effet de plus en plus de frictions entre le cadre théorique et la pratique quotidienne de la gestion documentaire et archivistique, au sein des administrations et services publics d’archives. Cette question de savoir si l’archivage électronique est une (r)évolution est régulièrement interrogée par les archivistes (voir notamment http://forum2016.archivistes.org/ ou la Gazette des archives http://www.persee.fr/collection/gazar).

Qu’archive-t-on quand on parle d’archivage électronique ?

Par son essence même (avec la dissociation du support -d’écriture, de lecture, de restitution- et du contenu informationnel), le numérique réinterroge effectivement sur ce qu’on souhaite archiver. Pour les archives numériques des administrations et des collectivités, il s’agit de manière prioritaire de conserver la mémoire des informations produites et échangées, en tant que trace des décisions de l’administration, avant de conserver la mémoire de l’expérience utilisateur ou la mémoire des systèmes techniques.

La conservation de la mémoire de ces informations se traduit aujourd’hui par la conservation, non pas des données « brutes » mais des données représentées dans une forme figée, c’est-à-dire dans un document défini comme support d’inscription (« le document est une inscription en contexte », Bruno Bachimont) ; et l’un des enjeux de l’archivage électronique est de pouvoir démontrer, dans le temps, la fixité du contenu informationnel enregistré sur le support d’inscription. La conservation de la mémoire de la forme (et pas seulement des données) est essentielle car elle participe de la démonstration de l’authenticité des informations.

Par ailleurs, le résultat d’un processus dématérialisé, se traduit généralement (pour ne pas dire toujours) par un document : un courriel, un fichier bureautique, un flux de données…et c’est cet objet qui est aujourd’hui préservé quand on parle d’archivage électronique. Lorsque cette trace n’existe pas dans une forme figée, l’archivage électronique va justement permettre de la figer. Pour illustrer mon propos, je prendrai l’exemple de la conservation de la mémoire des traces des actions sur les documents archivés dans un SAE : ces actions qui sont enregistrées en base de données sont également (pour les besoins de la démonstration de la qualité du dispositif d’archivage électronique) figées sur un support d’inscription (le journal du cycle de vie). La fixation s’accompagne généralement d’une signature électronique et /ou d’un horodatage afin de disposer d’éléments formels dans la démonstration de l’authenticité.

L’archivage des bases de données relève, me semble-t-il, de la même approche avec la réalisation d’instantanés de la base de données pour archivage : ces instantanés viennent figer les données dans leur représentation à un moment T.

Pourquoi l’archivage électronique ne décolle-t-il pas ?

S’agissant du marché de l’archivage électronique, je crois qu’il est en train de se mettre en place petit à petit. La première étape nécessaire et indispensable était celle de l’encadrement juridique de ce marché, compte tenu du caractère des archives qui avant d’être des objets patrimoniaux, ont un premier usage administratif au double sens d’opérationnel (pour la conduite des activités) et de juridique (pour la justification des droits des citoyens) et du statut protecteur de la réglementation sur les archives publiques qui appartiennent au domaine des objets mobiliers et qui sont protégées au titre des trésors nationaux. Les possibilités d’externalisation et de mutualisation sont aujourd’hui posées et encadrées, et des acteurs du secteur public commencent à s’organiser.

Pour autant, la difficulté principale réside en effet dans la capacité à extraire les informations à archiver de leurs environnements de production. Cet écueil est également partagé avec l’Open data (cf. thèse de Samuel Goeta, https://pastel.archives-ouvertes.fr/tel-01458098).

L’argument de la spécificité de la très grande majorité des applications me semble pouvoir être fortement atténué, d’une part parce que quelques éditeurs se partagent le marché du logiciel dans les collectivités et, d’autre part, parce que la spécificité des métiers est, de fait, partagée entre toutes les collectivités d’un même rang (communes, Départements, Régions) qui ont les mêmes missions.

Par contre, « l’absence de plateforme pour échanger, entre services d’archives, des connecteurs prêts à l’emploi pour les applications qui existeraient dans différentes collectivités » est une vraie question qui met en lumière à la fois une philosophie du partage des développements encore peu avancée dans la majorité des collectivités et l’absence de politique volontariste de l’Etat en matière d’archivage électronique, alors même que l’Etat est prescripteur en matière de dématérialisation.

Même si l’archivage est de la responsabilité de chaque collectivité, les enjeux liés à la conservation numérique sont tels que le sujet ne peut pas -ne doit pas- être porté individuellement par chaque collectivité mais collectivement avec l’Etat. A l’échelle des territoires, les collectivités commencent à s’organiser pour inscrire l’archivage électronique dans une double dimension de mutualisation (notamment des infrastructures techniques) et de solidarité (vise à vis des petites communes notamment).

L’un des enjeux de la conservation des archives numériques des collectivités est le défi de l’archivage électronique rapporté à la taille et aux moyens des collectivités. C’est pourquoi l’Etat (et pas seulement le ministère de la culture) doit avoir une vraie ambition, valoriser les expertises et coordonner les actions dans une optique orientée Centre de services. Le partage des expériences et des outils est une première étape nécessaire mais pas suffisante. Il faut capitaliser les expériences et expérimentations menées par les grands opérateurs que sont, la BNF, le CINES, l’INA ou le programme VITAM et permettre aux structures qui n’ont pas la taille critique, de pouvoir inscrire leurs projets dans la dimension du temps long avec une composante pérennisation forte. J’illustrerai mon propos en prenant l’exemple des formats. Les collectivités n’ont pas et n’auront pas les moyens d’avoir des spécialistes des formats (et d’ailleurs serait-ce raisonnable ?) pour autant, toutes seront confrontées à l’obsolescence des formats et aux migrations ; pourquoi ne pas imaginer un service, opéré à l’échelon national (peut-être par l’un des opérateurs cités, la BNF ou le CINES) de migration de format ?

Comment l’Open data peu booster l’archivage électronique et inversement

Je serais moins optimiste sur l’adhésion des décideurs aux politiques d’Open data…et sur les effets positifs (du type boomerang) d’une politique d’Open data sur l’archivage électronique. La raison tient à l’ambiguïté du terme archives qui se traduit, par le fait que, pour la majorité des personnes, les données publiées en Open data ne sont justement pas des archives…

Pour autant il existe de nombreux points de convergence entre pratique archivistique et pratique d’ouverture des données. Avant d’être ouvertes, les données passent en effet par une série d’opérations (identification, extraction et mise en œuvre de l’intelligibilité des données, voir http://i3.cnrs.fr/wp-content/uploads/2016/07/WPi3_16-CSI-01-Denis-Goeta.pdf) qui font écho à la pratique archivistique de l’évaluation, de la collecte et de la description des archives. Sur le terrain de l’identification, nous aurions tant à partager : l’archiviste a en effet une bonne connaissance des données et de la production documentaire !

Au-delà, Open data et archivage entretiennent également un compagnonnage, dans les principes et intentions. Les deux démarches font plus que se rejoindre, elles ont en commun les enjeux de transparence et de bonne gouvernance : il faut rappeler que la création des Archives nationales participe à l’origine d’une démarche de transparence administrative avant de s’inscrire dans une démarche mémorielle.

Dans un article intitulé « Open data ? : Data, information, document or record? », Erik Borglund et Tove Engvall (http://dx.doi.org/10.1108/RMJ-01-2014-0012), partagent les résultats d’une enquête sur le vocabulaire utilisé dans les documents de référence des discours de l’Open data et de l’archivage électronique. Les auteurs concluent que si le vocabulaire utilisé est différent dans les termes qui sont choisis, pour autant, un sens commun se dégage et c’est celui de Records, c’est-à-dire que le discours de l’Open data quand il utilise les termes de données et informations, c’est au sens de Records

Il apparaît donc indispensable et urgent de penser l’articulation entre Open data et archivage électronique au travers notamment de la question de la pérennisation des données mais aussi de celle la qualité des données.

Et, concrètement, sur le terrain, l’Association des archivistes français a noué un dialogue riche avec les acteurs de l’Open data (Fing, Datactivist.fr ou Open data France) et certains archivistes, comme à Saint-Etienne, sont également très investis dans les projets Open data de leurs collectivités.

J’imagine cependant l’articulation entre SAE et portails Open data un peu différemment. Pour moi, le SAE doit être le réceptacle des données à conserver (qui dépassent largement le périmètre de l’Open data), indépendamment de leur usage ET source d’alimentation des portails Open data (et non l’inverse…).

.Et le RGPD…

Il existe un levier important pour l’archivage électronique qui est le renforcement de la réglementation sur la protection des données à caractère personnel. Même si à première vue, tout oppose mémoire et droit à l’oubli, l’archivage électronique est aussi un moyen de sécuriser les données à caractère personnel tout simplement parce que les données archivées sont identifiées et gérées selon des règles (durée de conservation et habilitations d’accès) définies et contrôlées.

Le concept de Privicy by design est aujourd’hui porté par la CNIL. Ce concept veut que chaque nouvelle solution informatique ou technologie traitant des données à caractère personnel ou permettant d’en traiter garantisse dès sa conception, et lors de chaque utilisation, le plus haut niveau possible de protection des données et de préservation dans le temps en fonction de leur finalité d’usage. C’est, pour moi, une belle opportunité de gérer le cycle de vie des données dès leur création et sans rupture, tout en identifiant très en amont les modalités d’extraction et de versement des données dans un SAE…

Perspectives de consultation des archives numériques

Sur le terrain de l’accessibilité, l’un des défis est celui d’imaginer des dispositifs d’accès hybrides qui permettent d’interroger à la fois des corpus de données et les archives sur support papier, car il existe une filiation temporelle à maintenir entre les sources papier et les sources électroniques. Le risque sinon est celui d’une forme d’invisibilité croissante des archives papier au profit des données électroniques, parce que seules visibles sur Internet.

Il y a une autre grosse problématique qui est celle de l’exploitabilité des masses de données déjà versées, notamment aux Archives nationales. Ces jeux de données ne sont sans doute pas « exposables » en l’état, sans une (re)médiation, d’autant que la documentation de contextualisation qui les accompagne est, pour certains jeux de données, au format papier.

Tous les ingrédients sont là pour que l’archivage électronique devienne une réalité…Il faut s’emparer de la problématique sans défaitisme !