L’intelligence artificielle a-t-elle besoin de la propriété intellectuelle ?

par Jérôme Giusti, associé

Sollicités dans de nombreux projets qui utilisent une technologie d’intelligence artificielle, une question nous revient toujours en boucle : est-ce que le processus d’apprentissage par lequel la machine « apprend » à être « intelligente » oblige les concepteurs d’un tel programme informatique à respecter les droits de propriété intellectuelle lorsque pour ce faire, ils utilisent un contenu protégé par un droit de propriété intellectuelle ? A cette question, le droit cherche encore une réponse tant les robots transforment profondément notre monde et nos concepts juridiques les plus établis …

Qu’est-ce que l’apprentissage-machine ?

L’apprentissage-machine ou, en anglais « machine learning », concerne la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine d’évoluer par un processus systématique. Il existe plusieurs méthodes d’apprentissage (supervisée, non-supervisée, semi-supervisée, par renforcement ou apprentissage profond) mais toutes demandent de grandes quantités de données pour fonctionner correctement. Ainsi, la qualité des « décisions » prises par un algorithme d’intelligence artificielle dépend non seulement de la qualité des données utilisées pour l’entrainement (et notamment, leur homogénéité et leur fiabilité) mais surtout, de leur quantité.

Vulgarisons ainsi les choses : pour créer une intelligence artificielle dans le domaine ornithologique, les chercheurs collecteront des millions d’images d’oiseaux et indiqueront à la machine à quelle espèce d’oiseau correspond chaque image. Ensuite, ils entraîneront le système à produire une identification en fonction de l’image. Autre exemple : pour créer une intelligence artificielle dans le domaine musical, il faudra collecter des millions de titres de musique et entraîner la machine à les reconnaître. A force de reconnaître des millions de musiques, la machine renforcera progressivement sa stratégie et deviendra, de fil en aiguille, imbattable.

Parmi les multiples données ainsi traitées figurent donc bien souvent des contenus protégés par des droits de propriété intellectuelle : photographies, images, vidéos et textes, par exemple. Est-ce que l’utilisation de données protégées, dans le cadre d’un apprentissage-machine, oblige alors les concepteurs de programmes informatiques à requérir les autorisations nécessaires auprès des auteurs ou leurs ayants-droit et à en payer le prix ? Dans l’affirmative, existe-t-il néanmoins des exceptions ?

L’apprentissage-machine correspond-elle à une reproduction d’œuvres protégées au sens de la loi ?

Prenons l’exemple d’une intelligence artificielle qui utilise une base de données de musiques. Une œuvre musicale appartient à son auteur, à savoir le compositeur de la musique et/ou l’auteur des paroles et si cette musique est éditée, à son éditeur. Il s’agit du droit d’auteur. Si cette musique est interprétée par un artiste, ce dernier dispose également d’un droit sur cette œuvre, quant à son interprétation. Il s’agit du droit voisin de l’artiste-interprète. Un même droit voisin appartient également au producteur de cette musique. Tous peuvent s’opposer, à raison de leurs droits respectifs, à une utilisation de l’œuvre sans leur consentement.

L’article L 122–1 du Code de la propriété intellectuelle dispose ainsi que : « Le droit d’exploitation appartenant à l’auteur comprend le droit de représentation et le droit de reproduction ».

Au sens de l’article L 122–3 du même Code, le droit de reproduction se définit ainsi : « La reproduction consiste dans la fixation matérielle de l’œuvre par tous procédés qui permettent de la communiquer au public d’une manière indirecte. Elle peut s’effectuer notamment par imprimerie, dessin, gravure, photographie, moulage et tout procédé des arts graphiques et plastiques, enregistrement mécanique, cinématographique ou magnétique ».

La reproduction, « par quelque moyen que ce soit » et sans l’autorisation de l’auteur ou de ses ayants-droit, est une contrefaçon par application de l’article L 335–3 du Code de la propriété intellectuelle.

Ce principe souffre plusieurs exceptions, énoncées strictement à l’article L 122–5 du même Code, qui prévoit notamment :

- au paragraphe 1 : « Lorsque l’œuvre a été divulguée, l’auteur ne peut interdire, les représentations privées et gratuites effectuées exclusivement dans un cercle de famille »

- au paragraphe 2 : « Les copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, à l’exception des copies des œuvres d’art destinées à être utilisées pour des fins identiques à celles pour lesquelles l’œuvre originale a été créée et des copies d’un logiciel autres que la copie de sauvegarde établie dans les conditions prévues au II de l’article L. 122–6–1 ainsi que des copies ou des reproductions d’une base de données électronique »

- au paragraphe 6 : « L’auteur ne peut interdire la reproduction provisoire présentant un caractère transitoire ou accessoire, lorsqu’elle est une partie intégrante et essentielle d’un procédé technique et qu’elle a pour unique objet de permettre l’utilisation licite de l’œuvre ou sa transmission entre tiers par la voie d’un réseau faisant appel à un intermédiaire ; toutefois, cette reproduction provisoire qui ne peut porter que sur des œuvres autres que les logiciels et les bases de données ne doit pas avoir de valeur économique propre ».

Les mêmes exceptions au monopole des titulaires de droits voisins (artistes-interprètes et producteurs de musiques) existent, à savoir, selon l’article L 211–3 du Code de la propriété intellectuelle :

- au paragraphe 1 : « Les représentations privées et gratuites effectuées exclusivement dans un cercle de famille »

- au paragraphe 2 : « Les reproductions réalisées à partir d’une source licite, strictement réservées à l’usage privé de la personne qui les réalise et non destinées à une utilisation collective »

- au paragraphe 5 : « La reproduction provisoire présentant un caractère transitoire ou accessoire, lorsqu’elle est une partie intégrante et essentielle d’un procédé technique et qu’elle a pour unique objet de permettre l’utilisation licite de l’objet protégé par un droit voisin ou sa transmission entre tiers par la voie d’un réseau faisant appel à un intermédiaire ; toutefois, cette reproduction provisoire ne doit pas avoir de valeur économique propre »

Or, dans plusieurs systèmes d’apprentissage-machine qui nous ont été soumis, il apparaît que les concepteurs procèderaient bien à une « reproduction » des données collectées aux fins d’apprentissage de la machine, même si cette reproduction ne semble pas pérenne, les copies ainsi réalisées étant souvent destinées à être détruites après l’apprentissage.

Pourtant, dans bien des cas, ces données ne seraient pas destinées à être communiqués au public mais seulement à la machine pour qu’elle apprenne. Une fois qu’elle a appris, ces données deviendraient inutiles.

Se pose alors la question de savoir si la reproduction de données protégées par un droit de propriété intellectuelle, aux seules fins d’apprentissage, s’analyse comme une reproduction au sens de la loi et des exceptions précitées.

Cette question se scinde de fait en deux sous-questions :

  • Est-ce une reproduction au sens de l’article L 122–1 du Code de la propriété intellectuelle ?
  • A supposer que cela le soit, est-ce que cette reproduction peut être considérée comme une exception au sens des articles L 122–5- 6° et L 211–3–5° du même Code, à savoir une copie privée ou une copie provisoire présentant un caractère transitoire ou accessoire ?

(i) Est-ce que la reproduction aux fins de l’apprentissage-machine est une reproduction ?

Pour répondre à la première question, il convient de s’interroger sur le fait de savoir si la reproduction d’œuvres protégées aux fins d’apprentissage peut être assimilée à un procédé technique consistant en une fixation matérielle de l’œuvre permettant « de la communiquer au public d’une manière indirecte ».

Si la fixation matérielle des œuvres ne peut être déniée dans la plupart des cas d’apprentissage-machine, elle pourrait toutefois ne jamais aboutir à leur communication au public.

Nous pourrions alors peut-être en déduire qu’il n’y a pas de reproduction au sens de la loi sur le droit d’auteur et les droits voisins.

Toutefois, la loi française entend la notion de « public » de façon très restrictive.

Cette approche restrictive se déduit d’une interprétation a contrario des notions de copie privée et de cercle de famille, entendues au sens des articles L 122–5- 6° et L 211–3–5° du Code de la propriété intellectuelle précités :

- ne peut ainsi être considéré comme un public une personne qui se contente de copier une œuvre pour son simple usage privé, non destiné à une utilisation collective ;

- ne peut pas non plus être considéré comme un public le cercle de famille au sein duquel les représentations privées et gratuites d’œuvres sont autorisées.

Ces deux notions sont interprétées restrictivement par la jurisprudence.

Ainsi au-delà de la personne du copiste et du cercle de famille, toutes autres personnes devraient pouvoir être considérées comme un public qui, donc, nécessiterait, en cas de communication à son profit, une autorisation des auteurs, titulaires des droits voisins et de leurs ayants droits.

Toutefois, sous l’impulsion de la Cour de justice de l’Union européenne (CJUE), la notion de public s’est récemment élargie à « un nombre indéterminé de destinataires potentiels » impliquant un « nombre de personnes assez important » (dernier arrêt en la matière, CJUE, 3ème chambre, 29 novembre 2017, n° C-265/16 VCAST/RTI).

A contrario, un groupe de personnes constitué d’un nombre déterminé et limité de destinataires pourrait ne pas constituer un public et donc, une communication à destination d’un tel groupe pourrait ne pas nécessiter une autorisation préalable, à la condition toutefois, comme le rappelle la CJUE, que cette reproduction autorisée ne porte pas atteinte à l’exploitation normale de l’œuvre ni ne cause un préjudice injustifié aux intérêts légitimes du titulaire des droits.

Il existerait ainsi, sous cette réserve, une exception à une demande d’autorisation, allant :

- de la personne isolée du copiste,

- au cercle de famille,

- et à un nombre déterminé de personnes, peu nombreuses.

Cette jurisprudence a toutefois été prise dans une espèce particulière, à propos de services de « magnétoscope en ligne », permettant à des utilisateurs d’avoir accès via internet à des contenus télévisés après avoir demandé à une plateforme de les copier pour leur compte, qui est assez éloignée de notre cas de figure.

Elle a également été prise au regard de la directive 2001/29/CE du Parlement européen et du Conseil, du 22 mai 2001, sur l’harmonisation de certains aspects du droit d’auteur et des droits voisins dans la société de l’information, laquelle n’est pas d’application directe en France.

Au demeurant, l’interprétation que donne la CJUE de la notion du public, au regard de cette directive, n’a pas son équivalent en France, dans la loi ou la jurisprudence.

Cette interprétation extensive vient au demeurant « conflicter » la notion traditionnelle de cercle de famille qui justement, selon une jurisprudence bien établie, ne peut s’entendre d’un public élargi au-delà des « personnes parentes ou amies très proches qui sont unies de façon habituelle par des liens familiaux ou d’intimité ».

La question qui convient alors de se poser est donc de savoir si un public, au sens de la loi précitée, accède à la reproduction des œuvres pendant le temps de leur apprentissage par la machine.

Nous pouvons, à cet égard, imaginer que l’équipe de développeurs de la technologie d’intelligence artificielle en cause soient les seules personnes à y accéder avant que ces copies ne soient détruites.

Si cette divulgation va certainement au-delà du simple copiste isolé (à savoir celui et seulement celui qui fait la copie), elle ne semble pas non plus répondre au critère du cercle de famille (des collègues de travail n’étant pas compris dans ce cercle) mais possiblement à un nombre déterminé et limité de personnes, au sens de la jurisprudence de la CJUE.

Encore faudrait-il, pour que cette exception joue pleinement, que cette copie ne porte pas atteinte à l’exploitation normale des œuvres protégées.

En revanche, nous pourrions nous interroger sur le fait de savoir si ces copies ne causent pas un préjudice injustifié aux intérêts légitimes des titulaires de droit. Dans la mesure où ces derniers ne tirent aucun bénéfice de cette copie, notamment parce que cette reproduction n’a pas vocation à conduire à l’exploitation commerciale des œuvres ainsi reproduites, ceux-ci pourraient vouloir légitimement invoquer un préjudice à leur profit.

Tout est donc affaire de circonstances et il se pourrait bien que l’intelligence artificielle ne puisse donc pas se passer de la propriété intellectuelle pour exister. A moins qu’une dernière exception prévue par les textes, à savoir celle prévue pour la copie provisoire, soit alors applicable ?

(ii) Est-ce que la reproduction aux fins de l’apprentissage-machine est une reproduction provisoire, à titre transitoire et accessoire ?

Pour échapper à toute demande d’autorisation, au sens des articles L 122–5- 6° et L 211–3–5° du Code de la propriété intellectuelle précités, il faut que la copie réponde à plusieurs critères cumulatifs.

La copie doit être :

- provisoire ;

- présenter un caractère transitoire ou accessoire ;

- faire partie intégrante et essentielle d’un procédé technique ;

- avoir pour unique objet de permettre l’utilisation licite de l’œuvre ou sa transmission entre tiers par la voie d’un réseau faisant appel à un intermédiaire ;

- ne pas avoir de valeur économique propre.

Là encore, tout est affaire de circonstances.

Parmi l’ensemble de ces critères, le critère de l’objet unique, à savoir que la copie permette exclusivement l’utilisation licite de l’œuvre reproduite ou sa transmission par la voie d’un réseau faisant appel à un intermédiaire, ne nous semble pas rempli en l’espèce.

Les copies provisoires que les concepteurs d’intelligence artificielle effectuent ne nous semblent en effet pas destinées à permettre l’exploitation des œuvres ainsi reproduites.

Au contraire, ces œuvres n’ont généralement pas vocation à être diffusées postérieurement à leur copie, ou transmises via un réseau.

Elles servent uniquement à « entrainer » la machine.

Il ne nous semble dès lors pas utile d’interroger les autres critères qui auraient pu certes paraître pertinents, comme le caractère provisoire, transitoire ou accessoire de la copie, ainsi que le fait que cette copie puisse faire partie intégrante d’un procédé technique.

Quant au fait de savoir si cette copie n’a pas de valeur économique propre et sans qu’il soit nécessaire d’entrer dans le débat, puisque celui-ci s’avère dès lors inutile, ce critère pourrait également poser une difficulté : est-ce qu’une œuvre qui permet de « faire apprendre » une machine a une valeur économique propre ?

Au demeurant, l’exception susvisée a été imaginée pour répondre à une hypothèse particulièrement circonscrite, à savoir le fait de permettre de reproduire, à travers une « copie cache » sur l’ordinateur de l’utilisateur, la copie d’une œuvre notamment musicale aux fins de sa représentation au profit de ce même utilisateur, dans le cadre d’une utilisation normale et licite de cette œuvre.

Notre cas d’étude nous éloigne particulièrement de ce cas de figure et ne semble, à ce jour, pas avoir été appréhendé par le législateur.

Faudrait-il alors envisager une nouvelle exception aux droits d’auteur et droits voisins ? Pour les seuls besoins techniques permettant d’entraîner les machines ?

Le débat reste ouvert. Le droit des robots … encore à inventer.