L’importance des données ouvertes liées dans la découvrabilité des produits culturels québécois

Soad Carrier
museonum
Published in
8 min readApr 22, 2019
Photo by Franki Chamaki on Unsplash

C’est en novembre dernier que l’on annonçait les intentions du géant Netflix de produire et tourner un tout premier film québécois, une mesure faisant suite à une entente établie avec le gouvernement fédéral en 2017 (Radio-Canada, 2017). Cette nouvelle a été accueillie par plusieurs avec beaucoup d’enthousiasme, mais a également eu pour effet de délier certaines langues suspicieuses quant aux répercussions réelles de cette production, prédisant notamment la noyade du film parmi le flot trop abondant de contenus sur cette plateforme. De telles inquiétudes ne concernent pas exclusivement l’industrie du film et touchent l’ensemble des secteurs culturels, que ce soit ceux associés au domaine de la musique, au patrimoine, aux archives, ou aux arts visuels. La nécessité de parvenir à positionner de manière visible ces œuvres ou ces contenus au milieu de l’abondance d’informations publiées sur la toile est renforcée par la question linguistique. Il ne s’agit de rien de moins que de préserver et faire rayonner la culture francophone sur une toile majoritairement anglophone.

Tour d’horizon du paysage numérique

Depuis la première décennie des années 2000, nous avons assisté à l’émergence du web 2.0, un web social où l’internaute s’est retrouvé à la fois objet et sujet des activités numériques. Cet avènement a eu pour conséquence de générer un déluge d’informations mises à disposition sur la toile, mais également de permettre de définir des profils précis d’utilisateurs, que ce soit en lien avec leur mode de vie, de leurs intérêts, et plus encore. Aujourd’hui nous assistons cependant à un changement dans les habitudes de consommation du web qui est partiellement influencé par l’utilisation de tablettes et téléphones intelligents. Ce changement d’interface a pour répercussion première d’obliger les divers moteurs de recherche à réorganiser l’information présentée de façon efficiente dans le cadre d’un espace d’écran réduit.

C’est dans ce contexte que les recommandations de contenus ont pris une place de plus en plus importante. Les géants de l’internet tels que Google, Spotify, Netflix, ou YouTube et bien d’autres ont affuté leurs algorithmes afin de proposer les résultats les plus pertinents aux intérêts de ses utilisateurs. De ce point de vue, on peut dire que nous sommes entrés dans une ère du Web 3.0, un web intelligent où les réponses offertes à nos recherches sont souvent mesurées par les machines comme étant les plus à même de répondre à nos questions ponctuelles tout en prenant en compte notre historique d’intérêts quotidiens. Dans une telle situation, la question de la découvrabilité devient primordiale. Selon l’Observatoire de la culture et des communications du Québec (2017, p. 23), celle-ci se définit par la « capacité, pour un contenu culturel, à se laisser découvrir aisément par le consommateur qui le cherche et à se faire proposer au consommateur qui n’en connaissait pas l’existence ». Ainsi, dans une ère où le consommateur désire trouver rapidement et efficacement une réponse à son besoin, un contenu dont l’identité serait illisible par la machine ou comporterait une description partielle serait moins à risque de faire l’objet de sa recommandation.

Traduction numérique pour le contexte muséal

Au cours des dernières années, de plus en plus de musées se sont dotés d’une stratégie numérique afin de suivre l’évolution rapide des avancées technologiques. L’une des premières mesures entreprises dans le cadre de tels plan d’action ont consisté en la numérisation exhaustive des collections, un travail substantiel encore en cours aujourd’hui dans nombre d’institutions muséales. Malheureusement, comme nous l’avons expliqué, il ne suffit plus d’ajouter du contenu en ligne afin d’assurer sa présence numérique. Selon Clément Laberge (2019), consultant en cultures numériques : « Si les contenus culturels ne sont pas susceptibles de faire l’objet d’une recommandation, ils sont maintenant quasi invisibles ». Afin d’optimiser les chances de voir son produit culturel recommandé, il importe notamment de l’inscrire dans le web sémantique par le biais de données ouvertes liées (Linked Open Data soit LOD). En somme, il s’agit de traduire l’information mise en ligne, donc lisible par les humains, en métadonnées qui peuvent également être lisibles et interprétables par la machine, ceci dans l’optique de « faciliter l’échange, la modélisation, l’encodage et l’interrogation des données au sein des applications, des organisations et des communautés » (Observatoire de la culture et des communications au Québec, 2017, p. 85). Ainsi, lorsque l’on parle de données ouvertes liées, on envisage des données non seulement dans des formats lisibles informatiquement, dont les licences ouvertes permettent la réutilisation, mais qui sont également unies minimalement à d’autres informations (données liées). Les informations exprimées dans les formats du web sémantique peuvent de cette manière être associées entre elles en partageant certaines propriétés et leur expressivité autorise également un meilleur rapprochement entre celles-ci et les intérêts de ses utilisateurs.

Dans cette optique, il importe de développer un langage qui soit à la fois compréhensible par les différents algorithmes ratissant les données du web, mais également interopérable, c’est-à-dire dont la structure soit partagée entre les différentes institutions culturelles à travers le monde. L’objectif d’harmoniser les pratiques en termes d’utilisation d’ontologies ou de vocabulaires par l’emploi d’identifiants communs consiste à éviter le développement d’îlots de données incompatibles, alors que la mutualisation des informations permet une compréhension enrichie des objets décrits. Ainsi, différents types de standards ont été développés afin d’identifier les objets du web, notamment le Uniform Resource Identifier (URI), soit une « chaîne de caractères à syntaxe normalisée qui sert à désigner de façon unique et permanente une ressource par sa localisation ou par son nom » (Société des musées du Québec, 2017). L’URI s’apparente à l’URL (Uniform Resource Locator), à l’exception que ce dernier représente l’identifiant d’une ressource sur internet alors que le premier définit un objet unique (Observatoire de la culture et des communications au Québec, 2017, p.84). À titre d’exemple, l’ISBN (International Standard Book Number) est un identifiant unique qui permet de distinguer les produits culturels du domaine des publications. De par son caractère unique, il permet une traçabilité de l’utilisation des différents écrits. Un second identifiant qui présente un intérêt particulier pour le domaine muséal est l’ISNI (International Standard Name Identifier), dont l’objectif est d’identifier tout « contributeur de contenus culturels, scientifiques et techniques à travers le monde » (Ministère de la Culture et de la Communication, 2014, p. 15). L’attribution d’un ISNI aux artistes peut venir en aide à ces derniers à de nombreux égards, notamment en réglant les problèmes d’homonymie, en rattachant de façon pérenne toute production à son identifiant et permettant également une meilleure rétribution des droits d’auteur. Au Québec, c’est la Société de gestion de la banque de titres de langue française (BTLF) qui s’occupe de l’enregistrement de l’ISNI depuis août 2018 (BTLF, 2018).

Retombées pour les produits culturels

Ainsi, l’utilisation de données ouvertes liées contribue à assurer une présence au produit culturel dans le monde numérique. Elle permet à des créations plus nichées de se tailler la place qui leur est due sur la toile et « contrer l’action unilatérale des grandes multinationales et le processus d’homogénéisation culturelle mondiale qu’elle entraîne » (Culture Montréal, 2016, p. 4). En plus de proposer les différentes œuvres voulues aux internautes qui les recherchent, elles offrent également une visibilité supplémentaire au public susceptible de les apprécier. De bonne pratiques harmonisées concernant les données ouvertes liées au niveau international peuvent également avoir plusieurs autres avantages. Elles permettent tout d’abord de tisser un réseau d’informations qui viennent se complémenter les unes les autres, créant des produits culturels qui sont alimentés de données institutionnelles à travers le monde. Ceci amène une compréhension approfondie du produit, mais permet également de localiser ce dernier dans le contexte de son environnement et de déterminer l’usage qu’il en a été fait au cours des années. Il en résulte un produit plus riche et plus complet.

L’ouverture des données permet donc de mettre à disposition les informations à celui qui en a besoin, que ce soit en termes de consultation, mais également de création. En effet, l’ouverture des données autorise des organisations ou des individus tiers à réorganiser ou réutiliser celles-ci dans des contextes différents. Ainsi, la mutualisation de l’information permettrait de transmettre des connaissances dans le but de créer un produit culturel nouveau ou encore d’instaurer des guides de bonnes pratiques dans les musées. « Les technologies du web sémantique permettent dans ces conditions d’établir des liens entre des corpus autrefois isolés les uns des autres, voire d’autoriser de la sorte des découvertes de l’ordre de l’inattendu » (Ministère de la Culture et de la Communication, 2014, p.8). Grâce à l’ouverture des données, les différentes institutions n’avanceraient plus sur des chemins parallèles, mais seraient appelées à réutiliser et contribuer aux avancées d’autres musées dans l’atteinte d’objectifs communs.

Finalement, une bonne indexation de nos produits culturels permet de développer un public dont les intérêts se rattachent à celles des institutions muséales. En effet, au cours des dernières années, les différentes technologies ont amassé énormément de données sur ses utilisateurs. Ces informations peuvent aujourd’hui être mises à profit en étant associées au produit culturel qui lui corresponde le mieux : « il ne s’agit plus d’attirer le public vers l’œuvre, mais plutôt de faire en sorte qu’elle soit présente où se trouve déjà son public » (Culture Montréal, 2016, p.1). Dans les stratégies numériques développées par les musées dans les dernières années, l’on mentionne régulièrement le désir d’utiliser le numérique afin d’étendre son cercle d’influence et développer de nouveaux bassins de visiteurs. Une bonne indexation des produits culturels de ces institutions viendrait non seulement répondre directement à cette volonté, mais permettrait également de mieux comprendre le public intéressé par les activités du musée. Par conséquent, une meilleure compréhension des internautes touchés donnerait également l’occasion aux différentes institutions muséales de venir raffiner leurs différentes stratégies numériques dans l’objectif de proposer une programmation et des activités qui soient adaptés à leur intérêts.

L’utilisation de données ouvertes et liées présente un défi de taille à tous les niveaux. Elle demande tout d’abord un véritable engagement de la part de chaque institution afin d’intégrer de bonnes pratiques au sein même de celle-ci. Il importe également que ces bonnes pratiques s’inscrivent dans un mouvement international afin d’éviter la duplication d’informations, permettre la circulation libre des données et augmenter les chances de faire l’objet d’une recommandation par les différents moteurs de recherche. Cette mise en action doit être supportée par les têtes dirigeantes des institutions, mais doit également s’inscrire dans une vision globale endossée par les gouvernements en place. Ce n’est que lorsque les différents acteurs du domaine artistique viendront supporter et intégrer dans leurs pratiques l’utilisation de données ouvertes liées que l’on pourra accomplir cette transition numérique et assurer une place à nos produits culturels dans l’immensité d’informations qu’est le Web.

Bibliographie

Bisaillon, Jean-Robert. 2019. Les identifiants d’artistes en ligne : métadonnées et présence sur les réseaux. JEU, Revue de Théâtre. [En ligne] http://revuejeu.org/2019/03/10/les-identifiants-dartistes-en-ligne/

Culture Montréal. 2016. Adapter notre écosystème culturel à l’ère du numérique — Enjeux prioritaires. [En ligne] https://www.consultationscontenucanadien.ca/system/file_answers/files/27ce609568bd8a80acb34e1ce576eb77f1191426/001/393/526/original/Culture_Montreal_Adapter_notre_%C3%A9cosyst%C3%A8me_culturel_%C3%A0_l%E2%80%99%C3%A8re_du_num%C3%A9rique.pdf?1479406383

Laberge, Clément. 2019, FORUM 2019 — La découvrabilité en 2019 [Vidéo en ligne]. RIDEAU. [En ligne] https://www.youtube.com/watch?v=pbcGn6OAv6E&feature=youtu.be

Ministère de la Culture et de la Communication. 2014. Feuille de route stratégique — Métadonnées culturelles et transition Web 3.0. [En ligne] https://www.enssib.fr/bibliotheque-numerique/documents/64776-feuille-de-route-strategique-metadonnees-culturelles-et-transition-web-3-0.pdf

Observatoire de la culture et des communications au Québec. 2017. État des lieux sur les métadonnées relatives aux contenus culturels. [En ligne] http://www.stat.gouv.qc.ca/statistiques/culture/etat-lieux-metadonnees.pdf

Radio-Canada. 2017. Netflix financera des productions canadiennes, mais ses services ne seront pas taxes. [En ligne] https://ici.radio-canada.ca/nouvelle/1058369/netflix-impots-canada-financement-productions-canadiennes

Société des musées du Québec. 2017. Les données ouvertes au musée. [En ligne] https://www.musees.qc.ca/bonnes-pratiques/les-donnees-ouvertes-au-musee

Société des musées du Québec. 2017. Entretien Journée professionnelle SMQ Données Ouvertes. [En ligne] https://www.youtube.com/watch?v=xQlSgAI4RvU

Société de gestion de la banque de titres de langue française. 2018. Communiqué — La BTLF devient agence officielle ISNI. [En ligne] https://btlf.ca/la-btlf-devient-agence-officielle-isni/

--

--