Que se cache-t-il derrière cette ère de l’Open (big data, science, etc.) ? | MU 04.02.2016
Avec Guillaume Dumas, co-fondateur de HackYourPhD, & Célya Gruson-Daniel, co-fondatrice de HackYourPhD
Compte-rendu du Meetup réalisé à La Paillasse, le 04 février 2016.
Trois questions à…
Pourquoi un tel engouement pour le terme open science aujourd’hui ?
GD&CGD : Le terme “open” est de plus en plus présent, attaché à divers concepts. C’est notamment le cas de l’expression “open science”. Employée d’abord par les chercheurs pour revendiquer une façon de faire de la recherche, cette formule est désormais employée par les politiques scientifiques (OCDE, Commission européenne, etc.). Ce terme est un mot valise regroupant différents projets mais aussi différentes réalités et conceptions de la science et des pratiques de recherche associées. Il permet de décrire en effet un ensemble de transformations du modus operandi de la science avec le numérique tels que l’open access, l’open research data, les citizen science, etc. Mais ce qui nous paraît intéressant, c’est qu’il offre un moyen de comprendre les raisons et les intérêts de différents acteurs à s’emparer de ce terme, et à en définir les pratiques associées.
C’est ce que nous développons avec l’association HackYourPhD de façon collective, d’une part avec de la veille sur la thématique de l’open science et une présence dans des réseaux open science internationaux, d’autre part par l’organisation d’ateliers, de conférences afin de créer un espace de réflexion sur ces problématiques. Nous n’avons pas un rôle de lobby mais plutôt de médiation pour faire prendre conscience que différents mondes se rencontrent sous le terme open science et ne partagent pas forcément le même point de vue, notamment au niveau des valeurs sociétales sous-jacentes.
De façon personnelle, nous expérimentons tous les deux ce que recoupe l’open science avec une sorte de “mise en pratique”: Guillaume par des projets concrets en neuroscience et génétique à l’Institut Pasteur et Célya par une thèse en Sciences Humaines et Sociales (SHS) sur les discours et conceptions à propos de l’ouverture de la science et des pratiques de recherche. Une bonne façon d’avoir un regard à 360° sur ce sujet complexe.
Qui sont les différents acteurs de l’open science ?
GD&CGD : Les acteurs de l’open science sont nombreux et regroupent ceux impliqués dans le système de la recherche et de l’innovation, éléments moteurs d’une économie de la connaissance. Si l’on détaille, nous avons à un niveau “méta” les laboratoires de recherche, les entreprises/industries, les organisations de la société civile (notamment nouveau lieu innovant ou d’incubation), les agences de financement de la recherche, les structures de gouvernance de la recherche, les universités et lieux d’enseignements. A un niveau plus macro, il y a aussi le rôle des organisations supra-nationales (OCDE, Commission Européenne, UNESCO etc.). A un niveau micro, différents profils y sont regroupés : chercheurs, étudiants, entrepreneurs, bibliothécaires, citoyens, législateurs mais aussi ceux appelés “hackers”, activistes ou encore lobbyistes.
Plutôt que de demander qui sont ces acteurs, ce sont les motivations qu’ils défendent sous le terme Open Science qu’il est important de questionner. Pour cela le but de notre présentation sera de vous apporter des pistes sur ce que ce terme Open Science reflète et les intérêts qu’ils regroupent.
Que reflète le développement de l’open science ?
GD&CGD : Notre vision n’est pas celle d’une révolution de la science ou d’un changement complet de paradigme. Le développement de l’open science est plus le reflet de changements dans la production et la diffusion des savoirs mais aussi des valeurs et des représentations associées à la science, associés aux technologies numériques.
L’ère du numérique amène des reconfigurations à toutes les échelles et dans tous les domaines, notamment socio-économiques. Elles sont liées à la possibilité d’une “remise des cartes sur table” mais aussi au mouvement des lignes de front et des mécanismes de résistance qui viennent les contrecarrer. Dans le domaine de la science, l’open science reflète ces différents mouvements et tensions à l’oeuvre. Alors que la connaissance est le moteur d’une économie immatérielle, des mouvements de lutte pour leur reconnaissance comme communs se développent. C’est aussi le respect de la vie privée, connaissances associées à chacun de nous, qui est revendiqué.
Dans le microcosme de la science ou même plutôt du système de la recherche, ce sont ces transformations que l’on peut voir à l’oeuvre et qui nous permettent de réfléchir sur des questions de société plus globales.
Compte-rendu
Introduction
HackyourPhD est une communauté, puis une association, créée il y a plus de trois ans autour de la question de l’open science, avec la volonté de créer le débat. Depuis le début, le cœur d’activité de la communauté est la veille, facilitée par les réseaux sociaux. Au fil du temps, des discussions se sont développées et les réseaux sociaux ont pris un rôle de cahier de doléances et d’information sur le système de la recherche scientifique : qui apporte des connaissances sur le domaine de la recherche, ce qui se fait, les problèmes rencontrés. La communauté a ensuite, dans un deuxième temps, développé des ateliers thématiques, participé à des événements autour de ces questions puis s’est structurée. Il y a eu la création d’un blog avec mutualisation de toutes ces informations et la création d’une association.
Activités actuelles :
- Terrain : recueil d’entretiens et de témoignages pour essayer de cerner et de sensibiliser à l’open science ;
- Événement : les derniers en date sont les ateliers Open Geek centrés autour du code (aujourd’hui, ne pas savoir coder tend à être la nouvelle forme d’illettrisme).
Open science : notion récente, encore mal définie et complexe
Il y a plus de 3 ans, apparition du terme open access désignant le libre accès aux publications scientifiques. Le terme open science est de plus en plus employé sans pour autant être complètement défini.
Question au public : Qu’est-ce que l’open science ?
- Partage de la science, des informations, des découvertes ;
- Partage des données, ressources scientifiques ;
- Publications non enfermées dans des bases de données protégées dont il faut payer l’accès (pay wall) ;
- Problème du modèle économique.
L’open science est liée aux transformations actuelles venant des technologies numériques.
L’open science est une notion complexe qui gravite entre :
- La connaissance & la génération de connaissances, transfert par l’éducation ;
- Les technologies numériques et leur façon de catalyser et de changer les pratiques ;
- Les valeurs : transparence, ouverture & partage.
L’open science est aussi une formule de plus en plus utilisée. Les notions de partage, co-construction, collaboration, transparence renvoient à un imaginaire très fort, celui d’Internet et du réseau qui correspond lui-même parfaitement avec les idées de la science. Les valeurs de la science définies par le sociologue de la science Merton sont le communalisme (les “communs”), la valeur d’universalisme (global, peut circuler), le désintéressement (humilité, honnêteté et rigueur chez le chercheur).
Néanmoins, l’imaginaire d’Internet renvoie à deux difficultés qui se retrouvent dans le monde de la recherche : la question des modèles économiques et l’“enclosure” des connaissances.
“Open science refers to a scientific culture that is characterized by its openess. Scientists share results almost immediately and with a very wide audience.” S.Bartling & S.Friesike, Opening science : the evolving guide on how the Internet is changing research, collaboration and scholarly publishing.
L’open science, c’est aussi l’idée d’ouvrir tout le processus de la recherche et pas seulement les résultats. Il s’agit, par exemple, de faire une veille collaborative sur laquelle reposera l’ensemble de nos hypothèses ; d’ouvrir les données qui permettront l’analyse et donc les résultats ; d’ouvrir les notes et carnets de recherche (open notebooks).
- L’open access part du constat de l’existence de publications scientifiques qui ne sont pas accessibles. Si on ne fait pas partie de la recherche et si on n’a pas d’abonnement aux revues spécialisées, on est confronté à un pay wall.
- L’open research data (à ne pas confondre avec l’ouverture des données publiques : ouverture des données qui servent à faire de la recherche).
- Pour la partie software : les universités mettent à disposition des étudiants des logiciels propriétaires et donc coûteux. De plus, ces derniers sortent les données sous des formats propriétaires. Dans le cadre de l’open science, les logiciels doivent permettre un processus le plus ouvert possible comme Python.
Pourquoi est-il nécessaire de libérer les “enclosures” ?
Article de John P.A. Ioannidis, “Why most published research findings are false”, 2005. Ioannidis dirige un observatoire de reproductibilité à Stanford. Il y a mis en place des méthodes de méta-analyse pour voir à quel point la recherche scientifique est contaminée par des fraudes et des problèmes statistiques, intentionnels ou non. L’ouverture du code et des données devient un gage de la véracité des propos (transparence) et permet d’aller à l’encontre de l’idée problématique du “publier ou périr” (importante pour la reconnaissance ou le financement).
Pour lutter contre ces problèmes de reproductibilité et d’intégrité scientifique, il existe un centre de l’open science, le COS (Center for Open Science), créé par le psychologue Brian Nosek. Le COS a mis en place l’Open Science Framework, site qui permet aux chercheurs de partager les données, leurs codes et leurs articles, et d’écrire de façon collaborative. Mais à sa sortie, personne n’a voulu s’en servir par peur de se faire voler ses idées. Le COS a développé le Reproductibility Project : ils ont sélectionné 100 études en psychologie publiées mais jamais reproduites, ont contacté de nombreuses universités à travers le monde, ont utilisé leur plateforme pour faire une énorme campagne de reproductibilité. Seulement 39% de ces études ont été reproduites.
⇒ Open science : comment revenir à un système moins oppressant pour le chercheur et qui garantit une plus grande intégrité dans le processus de création des connaissances.
Open science : un buzzword.
Depuis quelque temps, le terme open science est à la mode. HYPhd adopte une attitude de questionnement à son encontre en étudiant notamment les discours qui l’entourent. Il existe plusieurs visions de l’open.
En recherche, tout est lié au financement, aux appels à projets. Les appels européens permettent d’avoir de grands financements. L’argent est ce qui conduit la recherche.
Carlos Moedas, Commissaire européen à la recherche, à l’innovation et à la science, a mis en avant les “3 O” :
- Open science ;
- Open innovation ;
- Open to the world.
⇒ Idée : l’open va permettre une prospérité économique et le développement de la connaissance. Dimension d’efficience, économie de l’open science. Il y a un basculement des modèles économiques.
L’argent est ce qui conduit la recherche.
Autre vision, celle de l’Unesco : l’open science a pour but premier de permettre l’accès aux connaissances qui est un droit humain. Ce n’est alors plus une valeur marchande mais un droit. Cette idée de droit renvoie aux communs : la connaissance comme bien commun que l’on doit apprendre à gérer ensemble.
Suivant cette définition, des fondations ont été créées :
- Open Knowledge Foundation qui définit l’ouverture non uniquement comme l’accessibilité mais comme la capacité d’accéder à la connaissance mais aussi de la modifier, la réutiliser et la redistribuer sans restriction ni distinction.
- Creative Commons, qui s’est attaquée à tout ce qui concerne la propriété intellectuelle, le cadre légal et la licence ; donne un gradient de restriction ou d’ouverture à un objet (i.e. “share alike”).
Une des licences virales par excellence, c’est la GNU public licence créée par Richard Stallman.
Les communautés, construites autour de l’informatique d’un côté et du free software de l’autre, illustrent la diversité des pensées face au statut de la connaissance :
- Vision marchande: l’open est plus efficace et rapporte. Exemple de la distribution Linux Red Hat, créée par Bob Young, qui a été la première à être commercialisée ⇒ utilisation de logiciels collaborativement créés mais avec un business model où les entreprises gèrent le SAV.
- Vision élitiste : l’open comme nécessité mais allant de paire avec une forme de gouvernance méritocratique. Exemple de Linus Torvald dans la communauté open source, qui garde le droit de veto sur le noyau de Linux.
- Vision libre, “free like in freedom not like in free beer” (Richard Stallman). L’open c’est une question de valeur, notamment de transparence, de collaboration et de partage.
Open : controverses & débats
Le terme open recouvre plusieurs controverses, plusieurs débats notamment sur la façon de considérer la connaissance et les enjeux de pouvoir auxquels elle renvoie. Volonté de montrer, de poser les questions et les nouvelles problématiques que cela engendre en termes d’éthique, de propriété intellectuelle.
Par exemple, en matière de controverse, l’open washing (en référence au green washing) :
- Predatory publishing : émergence de compagnies de publication scientifique qui demandent beaucoup d’argent pour publier sans pour autant faire de peer review (éditeurs prédateurs : qui font de l’argent sur l’idée d’open access).
- Uberized labor marketplaces and precariousness : ubérisation de la recherche. Système précaire de la recherche en France notamment pour les étudiants et les post-doc. Nécessité de faire attention que le terme open science ne vienne pas accentuer ça avec, par exemple, le crowd-funding de thèse. Évolution des cadres sociaux qui crée des zones grises et demande donc une certaine vigilance.
- Distributed revolution or New form of neoliberalism ?
- Discourse vs Practices : ouvrir ses données ne veut pas seulement dire les rendre accessibles.
- The Failure of Moocs : confusion avec du e-learning plus classique et constat que ce sont les personnes les plus éduquées qui y accèdent.
Échange avec le public
Public : Pour Richard Stallman, la notion de propriété intellectuelle n’existe pas, un avis ?
GD&CGD : La propriété intellectuelle, c’est un cadre qui a été construit. Les licences Creative Commons ont produit un travail sur la loi pour qu’elle soit compatible avec le cadre de la propriété intellectuelle.
Public : Comment expliquer l’intérêt qu’il y a à ouvrir une base de données sans utiliser l’argument scientifique, l’entreprise ayant pour vocation d’avoir un revenu, répond à des règles économiques ?
GD&CGD : Il y a dans la science, un côté très pur. De modèles économiques ont été essayés. Par exemple, pour l’open data, celle-ci n’est pas toujours immédiate. Il y a parfois des périodes d’embargo qui permettent de donner de l’avance à certaines personnes. Les modèles vont évoluer.
Voir le livre, Open models.
En France, il y a plein de données de santé qui pourraient être utilisées à bonne escient mais qui sont en-cloisonnées. Il y a un enjeu éthique derrière les données de santé. Présence d’un principe de précaution dur à négocier. Mais, si les données sont protégées en France, cela n’est pas le cas au niveau mondial avec une ouverture prononcée des data dans d’autres pays.
Réponse de la salle : le problème n’est pas de persuader une personne d’ouvrir sa base de données car celle-ci n’a d’intérêt que si elle est accessible, si des gens peuvent la traiter et produire des résultats à partir d’elle. Base de données c’est comme une plate-forme ; ce qui a de la valeur, c’est la production de connaissances. Les véritables problèmes sont comment se répartissent les efforts, comment ils sont évalués et comment se répartissent les bénéfices. Il ne faut pas forcément modéliser à partir de l’individu qui possède quelque chose car il ne possède rien mais n’a de valeur que dans son environnement de signifiants. L’important est de multiplier les chances pour qu’un investissement devienne rentable. Or la fermeture n’est pas la plus propice à cela. Les grands s’enrichissent en partageant mais ils choisissent leur place pour récupérer le plus de retombées.
Public : N’y a-t-il pas chez l’industriel une volonté de rechercher un équilibre vertueux entre le fait de redistribuer les outils en open source et l’externalisation de la R&D ?
GD&CGD : Oui, il y a pour certains une externalisation de la R&D claire.
L’open est le modèle le plus efficace. L’open renvoie à des idéaux extrêmes avec d’un côté l’idée du free et de l’autre celle de l’efficacité. Idée du digital labeur qui pose la question de la rétribution.
Réponse du public : travaux qui montrent que pour bénéficier au mieux de quelque chose, quand il y a des effets réseaux, il vaut mieux ouvrir la chose, se mettre au coeur du réseau et au attirer la plus value.
Public : Dans le champ de l’open science en santé, y a-t-il eu une réflexion sur la place de la vulgarisation de la science ? Qu’est-ce qui a été prévu comme outil, notamment dans le free ? L’open science est-elle accessible à des non scientifiques ?
GD&CGD : Il ne faut pas confondre open et accessible. Au niveau de la science, il faut faire un effort pour la rendre réellement accessible. Par exemple, PLOS (publication libre accès) oblige les auteurs, en plus du résumé scientifique classique, d’en faire un pouvant être compris par un public plus large.
Le phénomène est complexe comme on peut le voir avec les MOOCs où il y a les xMoocs (enseignant dispense, modèle top-down) et les cMoocs (collaboratifs, des individus génèrent ensemble de la connaissance permettant son appropriation par la pratique ; redonne une forme d’agentivité ; assimilation du citoyen dans la science).
Il existe aussi l’association Science Ouverte dont l’objectif est de créer des liens entre le monde de la recherche et d’autres sphères. Elle aide à la compréhension de la science.
Une implication de non chercheurs (exemple association de patients) est également possible dans les protocoles de recherche. Recherche avec une action participative plus développée aux États-Unis ou dans la culture nord américaine.
Sur ce sujet, voir le Mooc SciNum.
Public : Domaine de la santé renvoie à l’idée de démocratie sanitaire où le patient doit faire évoluer le système de soin. L’open science permet-elle une plus grande démocratie dans les sujets de recherche, notamment en santé ?
GD&CGD : Foundation non profit SAGE aux États-Unis où il y a une réflexion sur le patient center concerned : des consentements éclairés centrés sur le patient où ce dernier ne fait pas que signer un document qu’il ne lit pas. Volonté de faire un système où le patient reste maître de son consentement même après coup ; remettre dans sa main ses data pour qu’il décide à qui les remettre, quoi en faire et également un questionnaire pour vérifier qu’il comprend à quoi il s’engage.
Dimension de collaboration sur les choix des questions de recherche.
Il y a des associations de patients aux États-Unis qui ont même leur propre programme de recherche et vont subventionner des chercheurs. Cela se développe aussi en France.
Les chercheurs doivent travailler à reconnaître d’autres savoirs, par exemple, les savoirs locaux et traditionnels. Le savoir est souvent borné aux connaissances scientifiques. C’est une dimension de la science ouverte.
Public : L’open science n’entraîne-t-elle pas la fin du copyright ?
GD&CGD : Il y a différentes visions de l’open science. Il est tout à fait possible de faire quelque chose de plus “enclosé” avec le label open. L’open science n’est pas en soi une réponse mais un catalyseur de débat.
Public : Qu’est-ce qui freine les chercheurs à publier au stade de la recherche ?
GD&CGD : Il y a plusieurs explications à cela :
- Anxiété et problème générationnel : ce n’est pas dans les pratiques ;
- Peur de se faire doubler liée à une pression pour faire perdurer son laboratoire ;
- Économie de la crédibilité et de l’ego qui a un poids important : les chefs de laboratoire qui ne veulent pas se faire voler les découvertes.
- Poids des éditeurs : en France, on publie dans des journaux qui appartiennent à des éditeurs. Un chercheur peut ne pas avoir le droit de publier ses résultats parce que l’éditeur a un droit d’exclusivité. Chez certains éditeurs, plus le chercheur veut ouvrir sa recherche, plus il doit payer (i.e. Nature). Or, les journaux dans lesquels un chercheur publie ont une influence sur sa carrière. Poids de la métrique de la recherche.