ODbL et CC-BY-SA… cousines, mais pas jumelles !

La Loi pour une République numérique a instauré une limitation des licences utilisables par les administrations pour diffuser données et documents administratifs. Tant mieux !

C’était en effet nécessaire vu l’inutile diversité qui commençait à se répandre en la matière dans certaines collectivités, entreprises ou établissements publics (ODbL “du Grand Lyon”, ou “de la SNCF”, “licence gratuite de repartage” de la BAN).

Les licences, qu’elles concernent les logiciels, bases de données ou contenus divers, sont en effet une source de complexité et d’insécurité pour les ré-utilisateurs, ainsi que les producteurs.

Cette complexité liée aux multiples licences ne facilite pas les réutilisations, qui sont les fameuses externalités positives attendues par l’ouverture.
Dans le domaine du logiciel, la profusion de licences restreint au final le choix des développeurs dans le code ré-utilisable.

L’opendata étant beaucoup plus récent, on a heureusement une situation bien plus saine et en France, deux choix ont été faits par la quasi totalité des acteurs : la Licence Ouverte et l’ODbL (Open Database License).

La Loi Numérique a donc prévu une liste limitée de licences, liste publiée dans le décret n°2017–638 du 27 avril 2017 et qui prévoit uniquement ces deux licences (LO et ODbL).

La Loi impose aussi quelques principes sur les conditions de réutilisation (et donc sur les licences):

“Ces conditions ne peuvent apporter de restrictions à la réutilisation que pour des motifs d’intérêt général et de façon proportionnée. Elles ne peuvent avoir pour objet ou pour effet de restreindre la concurrence.”

La Loi prévoit aussi des homologations au cas par cas pour tenir compte de rares cas particuliers. Les principaux cas particuliers concernent les quelques données qui sont encore soumises à redevance par trois organismes: le SHOM, l’IGN et Météo-France. Ici le partage à l’identique est une façon de maintenir une diffusion avec redevance d’une version sans cette clause.

Le choix d’une licence n’est donc pas totalement libre, il faut qu’elle respecte ces trois principes.

La LO ne fait que reprendre les principes de la Loi, c’est à dire indiquer la source et le millésime.

Pour l’ODbL par contre, la clause de partage à l’identique peut être vue comme une forme de restriction à la réutilisation, il faut donc que ce partage à l’identique soit un réel motif d’intérêt général, proportionné et ne pas restreindre la concurrence (donc pas discriminatoire).

L’ODbL n’est et ne doit pas être une licence “anti-GAFA”

L’intérêt général est par contre justifiable dans la gestion collaborative de certaines bases où la remontée d’informations pour leurs mises à jour peut s’envisager avec une multitude d’acteurs non publics. On entre ici dans le domaine des communs.


Et la CC-BY-SA 4.0 ?

A première vue, depuis sa version 4.0, on pourrait la considérer équivalente à l’ODbL, mais ce serait une erreur. Ces deux licences comportent en effet une clause de partage à l’identique, mais il faut un petit peu plus creuser le sujet pour voir qu’il y a au moins une grosse différence.

L’ODbL ne couvre que les bases de données. Son partage à l’identique se propage uniquement à des bases de données, mais pas du tout aux œuvres produite à partir de ces bases de données (ce sont les “produced work” dans la licence). L’idée est ici de permettre l’amélioration constantes du contenu des bases de données sans aller au delà.

Le cas typique est bien connu avec les données géographiques OpenStreetMap. La base de données est sous licence ODbL depuis septembre 2012, mais les cartes produites avec ces données peuvent être sous n’importe quelle licence. Le fond de carte produit par la fondation OSM est par exemple sous licence CC-BY-SA 2.0 car l’ODbL n’est pas applicable à ce type d’œuvres.

D’autres fonds sont disponibles en CC-BY, CC0, voire sous licences commerciales (cas des cartes Michelin).

Quant à elle, la CC-BY-SA 4.0 peut s’appliquer à différents types d’œuvres, y compris aux bases de données. Son partage à l’identique se propage donc non seulement au bases dérivées, mais aussi aux œuvres produites à partir de ces données.

C’est donc une licence avec une propagation bien plus forte du partage à l’identiqueque l’on ne peut que très difficilement considérer comme d’intérêt général, car c’est là encore plus clairement qu’avec l’ODbL une restriction à la réutilisation.

Vu cette propagation du partage à l’identique aux œuvres produites, il est logique que cette licence n’ait pas été retenue dans la liste fixée par décret pour les bases de données.

Incompatibilité sur les bases de données

Cette propagation du partage à l’identique aux œuvres produites de la CC-BY-SA est aussi le point bloquant pour la compatibilité avec l’ODbL.

En effet, si l’on intégrait de données CC-BY-SA dans une base ODbL, l’ODbL ne permettrai pas de garantir que les œuvres produites seront elles aussi en CC-BY-SA comme exigé par cette dernière… vu qu’elle donne toute liberté en la matière.

A l’inverse, on ne peut pas non plus intégrer de données ODbL dans une base CC-BY-SA car elle impose des restrictions de réutilisation supplémentaires ce que ne permet pas l’article 4.8 de l’ODbL “You may not impose any
 further restrictions on the exercise of the rights granted or affirmed
 under this License”

L’utilisation en parallèle au sein de la sphère publique de ces deux licences créerait une confusion, limiterait mécaniquement beaucoup de réutilisations et serait une nouvelle barrière à la circulation des données !

Une autre bonne raison de ne pas la voir figurer dans la liste fixée par décret.

CC-BY-SA, oui mais…

Il reste des cas où la CC-BY-SA peut être adaptée: lorsqu’il s’agit de contenus autres que des bases données, un fond de carte est un bon exemple, une photo aérienne, etc.

Il ne faut par contre pas la confondre avec la CC-BY-SA-NC… comme le fait par exemple le SHOM:

Extrait document SHOM d’avril 2018

Non, la licence CC-BY-SA n’impose pas la gratuité de la mise à disposition des œuvres dérivées. C’est la clause “NC” (Non Commercial) qui l’imposerai par exemple avec une CC-BY-SA-NC.

Et non, il n’y a pas que la CC-BY-SA 4.0 qui soit compatible, il y a aussi la Free Artistic Licence 1.3 et la GPLv3.

Dernier point… ces fichiers SHAPEFILE qui sont des bases de données vectorielles (composés entre autre d’un fichier .dbf qui signifie “dBase database file” pour ceux qui n’en seraient pas sûrs), auraient bien mieux faits d’être sous licence ODbL.

Que choisir alors ?

Il est important de rester sur un principe simple et conforme à la Loi et son esprit :

  • Licence Ouverte par défaut (pour tout type de contenu sauf les codes sources logiciels qui ont leur propres licences adaptées)
  • ODbL pour les bases de données lorsqu’il y a un motif d’intérêt général démontré… par exemple sur des bases de données constituant de véritables communs avec des sources de données multiples et gérés comme tels
  • CC-BY-SA pour d’autres types de contenus où un partage à l’identique serait aussi d’intérêt général (démontré)