Intégrité scientifique et données de la recherche : comment se mettre en conformité avec le décret du 3 décembre 2021 ?

La société coopérative Datactivist et le consortium Couperin organisaient ce vendredi 18 mars un webinaire consacré à l’impact du décret n° 2021-1572 sur la conservation et la mise à disposition des données et codes sources, et la mise en œuvre des plans de gestion des données (PGD). Que faut-il en retenir ?

Antoine Blanchard
Datactivist
4 min readMar 22, 2022

--

Le gros succès du webinaire (plus de 900 inscrits, et 560 participants connectés simultanément) montre que ce décret suscite un fort intérêt et que les personnels de l’enseignement supérieur et de la recherche en charge des stratégies de conservation, des plans de gestion des données, du stockage des données, de la gouvernance des données, de l’intégrité scientifique… ainsi que les chercheurs et chercheuses eux-mêmes, se sentent concernés !

Les dispositions du décret qui touchent aux données et codes sources

C’est pour répondre à ces nombreuses interrogations que nous avons réuni un panel composé de :

  • Isabelle Blanc (administratrice ministérielle des données, des algorithmes et des codes sources / Ministère de l’enseignement supérieur, de la recherche et de l’innovation—MESRI)
  • Laetitia Bracco (conservatrice des bibliothèques et data librarian / Université de Lorraine ; animatrice du groupe Données / GTSO Couperin)
  • Etienne Augé (professeur de physique et vice-président adjoint à la science ouverte / Université Paris-Saclay ; coordinateur du réseau de référents science ouverte / France universités)
  • Océane Valencia (responsable des archives / Sorbonne Université ; membre du bureau Aurore / Association des archivistes français)
  • Alexandre Serres (référent à l’intégrité scientifique / Université Rennes 2 ; membre / Réseau intégrité scientifique—RESINT)

Voici le replay, et ci-dessous quelques idées fortes à retenir selon Datactivist :

  • les administrateurs et administratrices des données, algorithmes et codes sources (chief data officers) peuvent être chefs de file de la mise en conformité dans leurs établissements : en effet, ils sont proches de la direction et peuvent définir une “politique de conservation, de communication et de réutilisation des données” qui sera conforme aux spécificités et orientations de leurs établissements (analyse des risques et opportunités, cartographie des données…). En outre, ils ont par nature un rôle de coordination et travaillent déjà en réseau (avec les DPO, les RSSI, les fonctionnaires sécurité défense…) ;
  • les PGD deviennent l’outil central pour déterminer quelles données sont nécessaires à une recherche, quelles données peuvent être partagées et où, quel est leur devenir à moyen terme (conservation et archivage) —car le cycle des données numériques est très rapide et elles peuvent vite être perdues si ce n’est pas anticipé. Ajoutons qu’un outil comme DS Wizard pourra rapidement devenir indispensable pour permettre une vision d’ensemble et une gouvernance adéquate des PGD donc des données : cf. ce retour d’expérience d’une UMR Cirad / CIHEAM / Inrae / Institut Agro / IRD ;
  • pour instruire le devenir de ces données, question d’autant plus difficile que chaque discipline ou communauté est spécifique, les administrateurs des données, référents intégrité scientifique, DPO, archivistes, documentalistes… devront travailler ensemble dans une “alliance des métiers“ qui commence déjà à prendre forme autour des ateliers de la donnée (“guichets uniques” qui sont engagés dans un processus de labellisation par le MESRI) ;
  • le futur entrepôt national Recherche Data Gouv offrira une solution pour publier les données validées scientifiquement, pour les communautés (nombreuses) aujourd’hui dépourvues d’un entrepôt disciplinaire ;
Recherche Data Gouv : deux modules pour déposer, publier et signaler des données et trois modules pour accompagner les équipes de recherche sur toute question relative aux données
  • les établissements sont responsables des étapes de collecte, création, stockage et traitement des données, pour lesquelles ils doivent mettre à disposition des services de stockage et de calcul : les datacenters mutualisés deviennent courants dans l’enseignement supérieur et de recherche mais il manque encore des systèmes de cloud permettant au chercheur de glisser-déposer et synchroniser simplement ses données ;
  • l’inflation des volumes de stockage pourra être maîtrisée en déterminant à l’avance des règles strictes de conservation, inscrites dans le PGD. Ainsi, le PGD peut devenir le sésame nécessaire pour accéder au service de stockage, comme à l’Université Paris-Saclay ;
  • pour les codes sources utilisés dans le traitement des données, les choses se mettent progressivement en place : le projet PRESOFT a ainsi proposé un modèle de plan de gestion de logiciels.
Photo by National Cancer Institute on Unsplash

En conclusion, il apparaît que la mise en conformité avec le décret n° 2021–1572 du 3 décembre 2021 relatif au respect des exigences de l’intégrité scientifique par les établissements publics contribuant au service public de la recherche ne peut pas se faire du jour au lendemain, mais que le mouvement doit s’enclencher rapidement. La charge va reposer notamment sur les chercheurs et chercheuses, qu’il faudra embarquer grâce à un nécessaire travail d’explication et de conviction… sachant qu’ils pourront d’eux-mêmes apprécier les bénéfices d’un accès facilité à leurs données, bien documentées et conservées, et à celles de leurs collègues !

--

--