Les enjeux de la mise à niveau d’un système de gestion des collections et la migration des données : CinéTV vs Adlib

Mahsa Khalili
museonum
Published in
10 min readJan 18, 2021

The principle is that the data is there forever, but the system that manages it evolves over time. (Peyrard, Dappert et Guenther 2016)

La gestion des collections muséales soulève des enjeux importants qui font l’objet de nombreuses études académiques. Avec l’évolution des technologies numériques, les professionnels des science de l’information ont adopté et utilisé l’informatique à la fois pour améliorer les fonctions de gestion des collections et pour rendre les collections accessibles aux utilisateurs, tout en enrichissant les possibilités de recherche et d’interaction (Chapman 2013). Cependant, on parle de plus en plus de risques associés à l’obsolescence technologique des matériels et des logiciels qui évoluent constamment. Les évolutions d’un système informatique nécessitent parfois de changer de logiciel de gestion de bases de données. Ces changements présentent de nombreux défis et enjeux. Confronté à cette situation, la Cinémathèque québécoise a défini un projet de migration des données (CinéTV vers Adlib) pour accompagner ces changement.

La modélisation des données et le système de gestion de base de données relationnelle

La modélisation des données consiste en l’analyse des données afin de pouvoir les structurer et définir leur bonne représentation. Il existe des modèles de données différents.

Les modèles permettent de cerner un ensemble limité de caractéristiques d’une réalité du monde empirique. Tout type d’application informatique dépend fondamentalement d’une vision explicite et délimitée du monde. Les modèles permettent justement de construire et de communiquer cette vision explicite et délimitée. (Van Hooland et al., 2016)

La plupart des systèmes d’information utilisés par les institutions culturelles et patrimoniales reposent sur le modèle relationnel et donc sur l’utilisation d’un système de gestion de base de données relationnelle. On peut définir une base de données comme « un ensemble structuré d’éléments d’informations souvent agencés sous forme de tables, dans lesquelles les données sont organisées selon certains critères en vue de permettre leur exploitation pour répondre aux besoins d’information d’une organisation. » (Château-Dutier, 2020)

Processus autour d’une base de données (Dufour, 2019)

En fait, un système de base de données est un système informatique qui fonctionne comme un conteneur pour stocker des données, il est destiné à maintenir des informations et à les rendre disponibles à la demande. Les quatre composantes d’un système de base de données sont les données, le matériel, le logiciel, et les utilisateurs. Un système de gestion de bases de données (SGBD) permet d’assurer la cohérence des données, la sécurité et le partage des données, ainsi que l’indépendance des données par rapport au matériel et au logiciel. Il vise aussi à offrir des mécanismes permettant d’exploitation des liens entre les données. (Dufour, 2019)

La Cinémathèque québécoise et le projet de migration des données

En 2002, la Cinémathèque québécoise s’était dotée d’un outil informatique afin de répondre aux besoins de gestion de ses collections. Cette base dénommée CinéTV fut produite avec Microsoft SQL. Il s’agit d’une base de données relationnelle structurée en trois modules, avec la possibilité d’ajouter les informations pour les administrateurs de bases de données, ainsi que pour les experts de service de gestion de collections, et qui offre des fonctionnalités de recherche pour les utilisateurs finaux, c’est-à-dire les chercheurs. On y retrouve les informations sur les fonds d’archives et les collections, ainsi que des liens vers les documents numérisés.

Cependant, les évolutions des système informatiques nécessitent parfois de changer de base de données. Si au moment de sa conception en 2002, CinéTV répondait parfaitement aux besoins de ses utilisateurs, avec le temps cette base de données réalisée par un fournisseur externe pour les besoins propres de la Cinémathèque est devenue désuète et ses fonctionnalités limitées. Ainsi, l’obsolescence technologique de la base de données CinéTV a entraîné plusieurs problèmes comme des problème concernant la mise à jour des serveurs, mais surtout les difficultés avec la maintenance de la base de données devenue plus en plus difficile et coûteuse.

Le choix d’une nouvelle solution de gestion des collections est une étape importante dans un projet de migration de base de données. Pour ce faire, il est nécessaire de préparer un cahier de charge afin de préciser les besoins de l’institution. Ici, il est possible de s’appuyer sur la grille d’évaluation de logiciels de gestion de collections et les profils des fournisseurs de produits proposés par le réseau canadien d’information sur le patrimoine (RCIP) afin d’aider les établissements qui cherchent à mettre à niveau ou à acquérir un système de gestion des collections (SGC). Finalement, la Cinémathèque québécoise a sélectionné la base de données Adlib en remplacement de son outil développé pour des besoins internes.

Adlib est une base de données relationnelle produite par la société Axiell. Il s’agit d’un système de gestion des collections reconnu pour sa souplesse. Adlib peut s’adapter à différents types de collections. C’est une base de données très flexible et diverses versions spécialisées d’Adlib sont utilisées par de grandes établissements culturels nationaux dans le monde entier. Un des grands attraits d’Adlib réside dans le fait que la base de données est personnalisable. Les institutions peuvent personnaliser les versions spécialisées d’Adlib en utilisant un logiciel qui s’appelle Adlib Designer. Étant données leur nature adaptative, les applications d’Adlib peuvent être configurées par l’utilisateur pour composer avec toutes les situations selon les besoins spécifiques de l’institution. Cette flexibilité représentait un grand attrait pour la Cinémathèque, parce que cela rendait l’établissement indépendant du fournisseur dans l’adaptation de son produit.

CinéTV vs Adlib

La base de donnée CinéTV est composée de trois modules principaux : Le module Films qui est représenté dans six onglets, le module Documentation qui est représenté dans huit onglets, et le module Collections afférentes pour l’archivage des collections afférentes de la cinémathèque qui est représentée dans huit onglets et qui se divisent en onze sous-catégories.

Capture d’écran 1 : CinéTV, l’onglet « GENERAL » du module Collections afférentes

Chaque sous-catégorie est représentée par un ensemble de 2 lettres à la fin de son numéro d’accession dont : Affiches (AF); Animation (AN); Appareils (AP); Archives (AR); Audio (AU); Cédérom (CD); Fonds (FD); Objets (OB); Photographies (PH); Publication (PU) et Scénario (SC). Comme le souligne Véronneau : « Cette base possède des points d’accès spécifiques aux collections (Films, Documentation, Afférentes, Vidéocassettes) ainsi qu’aux multiples fichiers d’autorité.» (Véronneau, 2002)

Capture d’écran 2 : Adlib musée
Capture d’écran 3 : Adlib Biblio

En comparaison, Adlib offre différents produits pour plusieurs disciplines. La cinémathèque québécoise a acquis quatre modules. Adlib musée, Adlib Archive, Adlib Biblio, et Adlib Films et Vidéos. Les champs de chaque enregistrement des fonds sont organisés conformément aux normes spécifiques de collectionnement de ces secteurs d’activité. Les modules sont présentés dans des onglets et certains champs sont communs à tous les modules, par exemple : identification, contexte, contenu et structure, condition d’accès et utilisation, etc. certains onglets sont spécifiques à un module. Par exemple le module Adlib Musée dispose d’un onglet iconographie qui lui est propre. Aussi, dans le module Adlib Archive, l’onglet validation de description est spécifique. Tous les modules étaient existants et développés comme produit, mais la Cinémathèque a fait les modifications dans chaque module afin de personnaliser la description pour l’adapter aux besoins spécifiques de l’institution. Le module Adlib Films et Vidéos ont été notamment personnalisés par la cinémathèque en ajoutant un onglet spécifique au dépôt légal.

IFLA-LRM_Overview_of_Relationships (IFLA, 2017)

Par ailleurs, Adlib permet une organisation des données d’après le modèle FRBR (Functional Requirements for Bibliographic Records). Développé par IFLA en 1998, ce modèle permet une organisation des données en quatre niveaux (œuvre, manifestation, expression et item) qui permet de finement prendre en charge les phénomènes éditoriaux.

Les entités du premier groupe représentent les différents aspects de ce qu’un utilisateur peut trouver dans les produits d’une activité intellectuelle ou artistique. Les entités définies comme œuvre (c’est à dire, une création intellectuelle ou artistique déterminée) et comme expression (c’est à dire, la réalisation intellectuelle ou artistique d’une œuvre) en expriment le contenu intellectuel ou artistique. Les entités définies comme manifestation (c’est à dire, la matérialisation de l’une des expressions d’une œuvre) et comme item (c’est à dire, un exemplaire isolé d’une manifestation), à l’inverse, en expriment la forme matérielle. (IFLA, 2012)

Dans CinéTV, au sein du module Film, on avait deux niveaux de description : répertoire (œuvre) et item. Donc, il est nécessaire d’y ajouter des niveaux intermédiaires. L’ajout des niveaux intermédiaire est un travail assez complexe parce que les données pour ces deux niveaux se trouvent dans différentes parties de CinéTV, comme dans les commentaires par exemple. Par ailleurs, il est souvent nécessaire de normaliser le format des données. Cependant, il s’agit d’informations très utiles pour la Cinémathèque québécoise. Il y a plusieurs usages des manifestations par exemple afin de désigner des copies différentes ou des versions différentes en fonction du type d’œuvre. Il y a plusieurs usages pour l’institution liés à la possibilité de fractionner la description jusqu’à l’item. Le catalogage fonctionne à plusieurs niveaux, on peut alors accéder au catalogage par œuvre, par bobine, etc. La manifestation change selon la nature de l’œuvre qu’on est en train d’aborder.

Étapes de la migration des données

Changer de système de gestion de bases de données doit s’accompagner d’une bonne méthodologie. La planification de la migration, le processus de mapping, et les phases de tests doivent être rigoureusement suivies.

Un exemple simple de mappage de donnée
Un exemple plus complexe de mappage de donnée

La première étape de ce processus est le mapping. Il s’agit d’une étape extrêmement importante qui consiste à extraire des champs de données d’un ou plusieurs fichiers sources et à les faire correspondre à leurs champs cibles dans le système de destination. « Le mapping permet de consolider les données en les extrayant, en les transformant et en les chargeant dans un entrepôt de données.» (Fatima, 2020) Dans le cas de la Cinémathèque, il s’agissait d’aligner quatre modules formant un total d’environ mille quatre cents champs. Fait important, il convient de noter que des champs et desentités ont été ajoutés au cours de cette étape de mapping. En fait, la plupart des données de CinéTV pouvaient être alignées avec les champs par défaut offerts par Adlib, mais une quantité importante de données qui n’entraient pas dans les structures documentaires existantes. Ainsi, il était nécessaire de développer de nouveaux champs ou de modifier les caractéristiques des champs existants pour pouvoir importer les données sources.

Une fois cette étape de mapping terminée, vient la phase de tests. Essentielle, cette procédure permet de vérifier que toutes les fonctions sont bien récupérées dans la nouvelle base, mais aussi que les temps d’accès sont au moins équivalents à l’ancien système. La période des tests est une période très délicate. Il faut, en effet, pouvoir évaluer tous les scripts et toutes les requêtes possibles. La phase de tests permet de détecter et de corriger des anomalies sur des requêtes développées au fur et à mesure. En fait, il s’agit d’un processus cyclique. Après l’étape de mapping et l’ajout des champs, on réalise une première migration avec un échantillon des données pour servir aux tests. On réalise ensuite une série de validation qualitative et quantitative pour écarter les corruptions possibles des données ou les erreurs fonctionnelles, les variations, etc. Le résultat des problèmes observés avec les corrections et les modifications est ensuite envoyé aux fournisseurs pour apporter les modifications nécessaires. Après la complétude de développement de la base de données, l’exploration finale des données pourra avoir lieu et on arrive finalement à l’étape de la migration de la base de données et la livraison finale.

Les possibilités offertes par un nouvel outil font aussi prendre conscience des risques institutionnels, surtout en ce qui concerne l’insuffisance des ressources. Ainsi, la migration d’un système d’information oblige les organisations à penser aux formations nécessaires pour des professionnels de l’information afin de pouvoir utiliser de nouveaux outils dans leur pleine capacité et s’adapter aux nouvelles normes et standards adoptés pour toutes les collections et les fonds archives. L’adoption d’un nouveau système de gestion des collections change les façons de faire à plusieurs niveaux et lorsqu’on change d’outils, il faut également changer les pratiques. Ce qui implique des évolutions et des changements importants dans les façons de penser.

Bibliographie

--

--