Les nouveaux écosystèmes des données

Data Book
databook
Published in
36 min readMay 3, 2019

La circulation des données peut être porteuse de gains économiques, politiques, et constituer une source d’innovation bénéfique à la société. Cette circulation est d’autant plus nécessaire que les acteurs en capacité d’extraire de la valeur à partir des données ne sont pas nécessairement ceux qui les détiennent. L’opération de valorisation des données est le plus souvent complexe et nécessite l’intervention de différentes catégories d’acteurs répartis le long de la chaîne de valeur : les fournisseurs de données, les services d’analyse de données, les utilisateurs qui se servent des résultats de l’analyse des données dans leur activité et les consommateurs ou usagers finaux. L’économie fondée sur les données donne lieu à l’émergence d’un écosystème économique à l’intérieur duquel apparaissent de nouveaux modèles d’affaires et des formes originales de collaboration intra et inter-secteurs, privés ou publics.

Les enjeux de la circulation des données

La circulation des données devient un enjeu économique et politique, jusqu’au consommateur et au citoyen.

D’abord, en raison du caractère non rival des données, l’utilisation d’une donnée par un agent ne réduit aucunement sa disponibilité pour les autres agents. Plusieurs agents peuvent donc faire un usage simultané des mêmes données. S’ajoutent à cela les faibles coûts liés au stockage et à la circulation des données numériques. À l’époque des technologies analogiques, copier et réutiliser des données étaient encore des opérations coûteuses. Le passage à l’ère numérique change complètement la situation, en réduisant drastiquement les coûts et en simplifiant le transfert de données.

Deuxièmement, les données voient leur valeur et leurs possibilités d’usage démultipliées lorsqu’elles sont partagées et croisées avec d’autres jeux de données [47]. Pour reprendre l’image du sociologue Bruno Marzloff, « la valeur d’une donnée est proportionnelle au carré du nombre de données auxquelles elle est associée » [48]. C’est donc l’association de différents jeux de données, des données internes et externes à une organisation, qui permet d’en révéler tout le potentiel exploitable.

De plus, l’ouverture des données rend possible leur réutilisation par de nouveaux acteurs et pour des finalités qui n’ont pas nécessairement été prévues au moment où les données ont été collectées. Par exemple, l’analyse massive de données de santé recueillies dans le cadre de soins, avec l’accord des patients concernés, permet de développer des logiciels d’aide à la décision médicale. Les chances de réutilisation augmentent donc en proportion du périmètre d’ouverture des données. C’est la raison pour laquelle la circulation des données entre différentes organisations et entre différents secteurs d’activité devrait généralement être favorisée.

À l’inverse, une sous-utilisation des données n’engendre pas de gains économiques et sociaux. Si les données sont retenues dans des silos, une part importante de leur valeur risque de ne jamais en être extraite. À ce titre, l’interopérabilité des données joue un rôle clé dans la circulation des données.

Cependant, il n’est pas facile de mesurer précisément les retombées positives des données [49]. Non seulement la valeur économique des données reste difficile à appréhender, mais quantifier leur influence positive sur les échanges scientifiques et culturels, sur les changements sociaux ou sur la confiance est une opération plus délicate encore. C’est pourquoi l’OCDE craint que les difficultés à saisir l’ensemble des externalités positives liées aux données ne se traduisent en termes de sous-investissements en matière de données et d’analyse de données et ne conduisent à une situation dans laquelle l’accès aux données est socialement sous-optimal.

Pour autant, l’ouverture des données peut connaître des limites et leur accès ne doit pas nécessairement être libre et gratuit. Tous les travaux portant sur le sujet soulignent l’importance de trouver un juste équilibre entre les bénéfices économiques et sociaux de l’ouverture des données et la protection de l’intérêt légitime de leurs détenteurs. Ces derniers peuvent avoir de bonnes raisons de vouloir conserver pour eux certaines données, dont certaines sont d’ores et déjà consacrées par le droit : sécurité, protection de la vie privée, du secret des affaires ou des droits de propriété intellectuelle. En matière d’ouverture, l’alternative ne se réduit pas à une opposition binaire entre « données ouvertes » et « données fermées ». Entre les deux termes, il existe différents degrés d’ouverture possibles. Toute la question est de savoir où placer le curseur. Une organisation peut choisir de rendre ses données accessibles gratuitement, d’autres peuvent décider de les vendre. L’accès aux données peut être limité à certaines personnes, il peut au contraire ne connaître aucune restriction, etc.

Le niveau d’ouverture adapté dépend chaque fois du secteur d’activité concerné et du degré de maturité de son écosystème. Préalablement à toute ouverture de ses données, une organisation doit se poser certaines questions : quelles sont les données concernées par l’ouverture ? Qui peut avoir accès à mes données ? Quelles sont les conditions d’accès et de réutilisation des données ?

Quelles sont les données concernées ?

L’ouverture peut être limitée à certains jeux de données. Toutes les données n’ont pas la même valeur stratégique au sein d’une organisation. Certaines peuvent être considérées comme accessoires par rapport à ce que l’organisation considère comme le centre de son activité ; d’autres, au contraire, touchent au coeur de la valeur créée par l’organisation. De plus, une organisation peut n’exploiter qu’une partie des données en sa possession, laissant en jachère une partie d’entre elles. Il appartient à l’organisation de dresser l’inventaire des données qu’elle détient et d’engager une réflexion au cas par cas sur les bénéfices qu’elle peut attendre de leur ouverture, au-delà des données publiques dont l’ouverture est prévue par la loi.

Qui a accès aux données ?

Ouvrir ses données ne signifie pas nécessairement y donner un accès libre à tous, excepté pour certains acteurs concernés par des obligations d’ouverture. Une organisation est libre de déterminer le degré d’ouverture qu’elle souhaite conférer à ses données : ne pas ouvrir ses données, les partager avec des organisations partenaires, mutualiser ses données avec ses concurrents sur une même plateforme, les partager avec les autorités publiques ou encore les rendre accessibles au public. Tout dépend des objectifs qui sont recherchés par l’organisation. La mutualisation des données de filière permet par exemple à des entreprises concurrentes d’enrichir la connaissance respective qu’elles ont de leur marché tout en partageant les coûts d’analyse. C’est dans un objectif de transparence que Nike a rendu publiques des informations sur sa chaîne d’approvisionnement, à la suite du scandale lié au travail des enfants dans les années 1990. De son côté, Airbnb a créé le portail Dataville qui permet « aux municipalités de mieux suivre le développement de l’activité touristique via Airbnb sur leur commune, son impact positif sur l’attractivité de leur commune comme sur le pouvoir d’achat de leurs administrés », comme l’explique l’entreprise dans le communiqué de lancement du portail. La loi peut par ailleurs imposer la communication de certains jeux de données détenus par des acteurs privés dans le cadre de certaines délégations de services publics.

Un certain nombre d’entreprises de cloud computing proposent des services de partage de données qui permettent à leurs clients de rendre leurs données publiques, ou de les partager avec des partenaires spécifiques. Ces solutions permettent également de partager des données au sein d’une même organisation.

Quelles sont les conditions d’accès et de réutilisation des données ?

Une fois qu’elle a décidé d’ouvrir une partie de ses données, une organisation peut encore fixer les conditions auxquelles les tiers pourront y accéder. L’accès aux données peut être gratuit ou payant.

Le marché des données reste embryonnaire. S’il existe quelques places de marchés comme Infochimp, Datamarket, Factual ou Microsoft Azure, ou des plateformes spécialisées dans des secteurs intégrés comme la mobilité, l’agriculture ou la logistique, la plupart des données ne sont pas directement commercialisées sur un marché qui organise la rencontre de l’offre et de la demande. Elles sont souvent exploitées en interne ou dans le cadre d’accords de partenariat. Elles fournissent un modèle économique qui rend accessibles des données qu’il serait autrement difficile d’échanger. De plus, elles contribuent à rendre les données directement utilisables par des tiers, en prenant en charge les opérations de nettoyage et de formatage, et en les complétant par des métadonnées (par exemple, des indicateurs de qualité).

Certains considèrent que l’échange de données contre de l’argent est un modèle en perte de vitesse. Comme le soulignent Simon Chignard et Louis-David Benyayer, « Seuls les producteurs les plus puissants, ou ceux qui sont capables de garantir l’exclusivité de leur service sont en mesure de maintenir durablement leur position sur le marché des données » [50]. Thésauriser les données dans l’attente d’en tirer un prix élevé est une stratégie improductive et inadaptée aux spécificités de l’économie numérique.

Des modèles rivaux à l’échange monétaire existent :

  • Les données peuvent tout d’abord être échangées contre d’autres données : l’accès à une base de données a alors pour contrepartie l’enrichissement de cette même base par son utilisateur.
  • Les données peuvent être échangées contre des services gratuits. Ce modèle est à la base des modèles économiques bifaces adoptés par des entreprises comme Google ou Facebook. Elles fournissent des services gratuits à leurs utilisateurs, en échange de la collecte de leurs données personnelles.
  • Un autre modèle d’échange consiste à ne plus attacher de valeur pécuniaire aux données brutes mais aux services issus des données. Par exemple, la société Avuxi rassemble l’ensemble des avis laissés par les touristes dans une ville pour identifier les hôtels et les restaurants les plus populaires. Ces informations sont ensuite revendues aux voyagistes et aux portails de réservation.

Après avoir fixé les conditions d’accès à ses données, une organisation peut encore en déterminer les conditions d’utilisation. Elle peut par exemple interdire certains usages de ses données ou empêcher leur diffusion auprès de tiers.

L’émergence de nouvelles modalités d’interaction entre acteurs : vers la « coopétition »

L’écosystème des données donne lieu à des interactions nombreuses entre des acteurs qui se positionnent à différents niveaux de la chaîne de valeur : fabricants de logiciels et de matériel, producteurs de données, prestataires de services de traitement des données, fournisseurs de produits et de services qui intègrent les données dans leur activité, utilisateurs finaux. Les acteurs occupent parfois plusieurs niveaux à la fois de la chaîne de valeur.

L’activité des organisations génère, par exemple, des données qui peuvent servir à améliorer la qualité du service proposé et au développement de compétences en matière d’analyse de données. Mais ces données peuvent aussi être revendues sous forme de services à d’autres organisations. Ainsi, les machines agricoles du fabricant John Deere collectent des données. Ces dernières sont exploitées par la société, qui les restitue à ses clients sous forme de services de gestion agricole. Dans le même temps, ces données intéressent aussi les entreprises de biotechnologie, les compagnies d’assurance et les marchés des matières premières, qui sont prêts à payer pour se les procurer.

Au sein de cet écosystème, l’exploitation des données massives prend la forme d’un mélange de compétition et de coopération entre les différents acteurs, phénomène qui est parfois qualifié de « coopétition ». Parce qu’une entreprise n’a pas forcément l’expérience nécessaire ou les compétences techniques requises pour traiter et analyser les données qu’elle détient, elle va chercher à s’attacher les services d’une autre entreprise qui dispose de ces compétences, mais qui, elle, ne possède pas nécessairement les bonnes données, ou qui ne serait pas en mesure de restituer la valeur de ces données sous forme de produits ou de services. Cette association peut prendre la forme d’un accord de partenariat, de l’achat d’une prestation de services ou encore de l’acquisition d’une entreprise par une autre.

L’écosystème numérique évolue rapidement sous l’effet conjugué des innovations technologiques et de l’arrivée de nouveaux acteurs. Comme dans d’autres secteurs, les entreprises les mieux établies ne cherchent pas seulement à consolider leur position en établissant des partenariats ou en proposant des produits innovants, mais également en rachetant d’autres entreprises et les startups les plus prometteuses. Pour elles, c’est une façon de proposer de nouveaux services, d’obtenir de nouveaux brevets, d’éliminer un concurrent potentiel ou encore d’empêcher qu’un de leur concurrent ne s’en empare avant eux. Les collaborations sont un autre moyen pour les entreprises du secteur de renforcer leur position au sein de l’écosystème. Ces partenariats laissent par ailleurs apparaître une convergence entre l’économie numérique et d’autres secteurs d’activité.

Source : Renaissance Numérique, La valeur des données agricultures, février 2018

Les Application programming interfaces (API)

En permettant à des développeurs extérieurs d’accéder à un ensemble de données ou de ressources logicielles pour les intégrer à des applications externes, les API (application programming interfaces) sont devenues un vecteur essentiel de la circulation des données. Elles sont à l’origine du développement des applications et de la croissance des plateformes numériques. Les API permettent à des tiers de développer de nouveaux services autour des données détenues par une organisation, tout en garantissant au détenteur des ressources la faculté de contrôler leur utilisation. Comme le résume Mehdi Medjaoui, fondateur des API Days, les API offrent un « accès et non pas un actif » [51]. Le détenteur des ressources peut continuer à contrôler qui a accès à quoi, où, comment et combien de fois. Il peut par exemple fixer les conditions d’utilisation, refuser l’accès à son API à certains développeurs ou décider d’arrêter un contrat à tout moment s’il l’estime nécessaire. C’est un modèle de partage qui permet donc d’être à la fois ouvert et propriétaire, un point d’ouverture, mais aussi un point de contrôle.

Les avantages d’une API pour le détenteur des ressources sont nombreux. L’ouverture d’API à des développeurs extérieurs permet l’émergence d’un écosystème d’applications couvrant un « périmètre beaucoup plus large que celui qu’aurait pu mettre en chantier une seule entreprise » [52]. De plus, lorsqu’il est payant, l’accès à l’API constitue une source de rémunération pour son propriétaire. Celui-ci peut par exemple se rémunérer sur le chiffre d’affaires réalisé par les développeurs. Enfin, les API permettent d’attirer au sein d’un écosystème des entreprises qui auraient autrement pu développer des services concurrents. Pour les développeurs, les API se présentent sous la forme de briques technologiques facilement paramétrables et prêtes à l’emploi, qui ne nécessitent pas de connaître la logique interne du logiciel tiers. Un autre avantage de l’API est d’offrir un accès à une donnée « ubiquitaire et instantanée » : lorsqu’une donnée change dans un système, elle est automatiquement mise à jour dans les autres systèmes [53]. Inversement, lorsque les données sont partagées sous forme de fichier, les réutilisateurs doivent recharger l’ensemble du fichier à chacune de ses mises à jour. C’est ainsi l’obtention des horaires de la RATP en temps réel via une API, et non uniquement des horaires théoriques sous forme de fichier, qui a permis à Citymapper de développer un véritable service [54].

L’ouverture des données peut par ailleurs s’inscrire dans des démarches collaboratives d’innovation ouverte ou de crowdsourcing. Une organisation peut procéder à une ouverture ponctuelle de ses jeux de données dans le cadre d’une compétition ouverte (hackathon) pour obtenir les meilleures analyses. Le travail collaboratif entre développeurs et analystes de données peut permettre d’atteindre des résultats plus rapidement et à moindre coût que des travaux menés individuellement ou en petit groupe pour le compte de l’organisation. La plateforme InnoCentive organise par exemple des concours dans lesquels elle propose à des « scientifiques » externes (la plateforme compte 380 000 inscrits) de résoudre des problèmes pour le compte d’autres organisations. Les sujets proposés au concours sont généralement spécifiques et concernent des questions complexes qui n’ont pas trouvé de solutions en interne ou des questions secondaires sur lesquelles l’organisation ne souhaite pas engager de ressources. La personne qui remporte le concours se voit offrir des récompenses pouvant atteindre plusieurs dizaines de milliers de dollars. Dans un autre registre, le portail Internet Zooniverse propose aux internautes de participer à des projets de recherche scientifique en accomplissant certaines tâches qui ne peuvent pas être accomplies par des ordinateurs. Par exemple, dans le cadre du projet Old Weather, 16 400 volontaires ont retranscrit les données météorologiques contenues dans plus d’un million de pages de carnets de la Royal Navy.

Faciliter la circulation et la réutilisation des données : portabilité et interopérabilité

La portabilité et l’interopérabilité sont des éléments essentiels à la circulation des données et au partage de la valeur issue de leur utilisation. Le règlement européen sur les données personnelles a introduit un droit à la portabilité qui permet aux individus dans des cas expressément définis de récupérer les données qu’ils ont générées et qui sont stockées et traitées par un prestataire, en demandant qu’elles leur soient communiquées directement ou transmises à une autre entité, là aussi dans des cas définis. La circulation des données passe aussi par la portabilité des données à caractère non personnel, qui n’est pas, à l’heure actuelle, consacrée par la loi, malgré de timides avancées au niveau européen [55].

En facilitant la migration des particuliers et des professionnels entre deux prestataires, la portabilité des données favorise la concurrence entre les services. Elle permet également aux fournisseurs de données de conserver la maîtrise de leurs données : une organisation pourra, par exemple, récupérer ses données pour les réutiliser en interne ou avec d’autres acteurs, en vue de développer de nouveaux services. Il s’agit d’éviter les effets de « verrouillage » qui rendent excessivement complexe, sinon impossible, la récupération des données auprès d’un prestataire et qui aboutissent à ce que ce dernier capte l’intégralité de la valeur créée à partir de celles-ci [56].

Or, la portabilité est en grande partie conditionnée par les modalités de sa mise en oeuvre, qui a un coût non négligeable pour les organisations, et dont les effets ne sont pas encore évalués. Le règlement européen sur les données personnelles précise que les données doivent être fournies dans un format « structuré, couramment utilisé et lisible par une machine ». Le règlement européen sur le libre flux des données à caractère non personnel va dans le même sens. L’utilisation de normes ou de standards informatiques fermés — quand le référentiel n’est pas diffusé, ou quand il est soumis à des restrictions d’accès — est un frein à l’échange et à la réutilisation des données [57]. Même quand une donnée est rendue accessible, elle ne peut pas nécessairement être réutilisée si son format n’est pas pris en charge par un autre système, ou si elle est diffusée par une API propriétaire qui en limite l’usage. L’interopérabilité des données est facilitée par l’adoption de standards internationaux, tant sur le plan sémantique que technique (XML, JSON, CSV, etc.) et dont l’utilisation n’implique pas l’acquisition d’un logiciel ou d’une licence payante. Le Conseil national du numérique (CNNum) recommande à ce sujet la définition de standards techniques d’interopérabilité de concert avec les industriels et les associations professionnelles et l’utilisation d’interfaces de programmation (API), permettant de transférer directement les données d’un opérateur à un autre et d’interroger automatiquement de vastes bases de données [58].

Vers la plateformalisation pour organiser ces nouveaux écosystèmes

Les plateformes, pivots des écosystèmes des données

La notion de plateforme rassemble une grande variété d’activités, puisqu’on y retrouve aussi bien les places de marché en ligne, les moteurs de recherche, les magasins d’applications, les comparateurs de prix, les réseaux sociaux, les systèmes de paiement, les plateformes d’économie collaborative, etc. [59] En dépit de cette diversité, les plateformes en ligne partagent certaines caractéristiques clés, telles que « l’utilisation des technologies de l’information et de la communication pour faciliter les interactions (y compris les transactions commerciales) entre utilisateurs, la collecte et l’utilisation de données sur ces interactions et les effets de réseau qui rendent l’utilisation des plateformes avec le plus grand nombre d’utilisateurs plus utile » [60]. Ces entreprises jouent un rôle pivot dans les écosystèmes des données. Intervenant aux différents stades de la chaîne de valeur des données, les plus grandes d’entre elles disposent d’un pouvoir de marché considérable qui leur permet d’animer et d’organiser autour d’elles tout les écosystèmes d’acteurs [61].

L’intermédiation est au coeur du modèle économique de la plateforme : les plateformes mettent en relation des vendeurs et des acheteurs, des prestataires de service et des utilisateurs, etc. La plateforme est à la fois un point d’accès et un point de contrôle autour duquel s’organise un écosystème. En tant que point d’accès, la plateforme est incontournable : elle possède une communauté d’utilisateurs à laquelle ses partenaires ne peuvent avoir accès que par son intermédiaire. Cette position centrale lui confère par ailleurs un très important pouvoir de contrôle. C’est elle qui définit les modalités techniques, juridiques et financières de ces partenariats.

Les plateformes sont par ailleurs les acteurs économiques qui extraient le plus de valeur à partir des données. Leur modèle économique a d’ailleurs largement contribué à la prise de conscience de cette valeur. Certaines entreprises ont bouleversé les règles dans l’industrie du transport et de l’hôtellerie, en ne détenant pas d’actifs physiques, tels que des biens immobiliers ou des véhicules, et en n’investissant pas dans leur gestion [62]. Les services que ces plateformes proposent reposent intégralement sur le traitement et l’organisation des informations fournies par les utilisateurs. À partir de ces informations, l’entreprise est en mesure d’enrichir son service d’intermédiation, notamment en faisant des recommandations sur les prix ou au travers d’un système de notation par les pairs pour guider les utilisateurs dans leurs futurs choix et ainsi renforcer la confiance des utilisateurs dans la plateforme.

De plus, les plateformes exploitent systématiquement les effets de réseau [63]. C’est-à-dire que l’utilité de la plateforme est proportionnelle au nombre de ses utilisateurs. La plateforme peut s’appuyer sur des effets de réseau indirects : elle ouvre ses ressources, notamment ses jeux de données, à des développeurs extérieurs, afin qu’ils développent une offre complémentaire de services qui renforcera en retour l’attractivité de la plateforme. C’est ainsi qu’Apple bénéficie pour ses téléphones d’une riche offre d’applications mobiles développées par des entreprises tierces. La plateforme peut aussi profiter d’effets de réseau croisés. En exerçant son activité sur un marché, une entreprise constitue une audience qu’elle va ensuite pouvoir valoriser sur d’autres marchés. L’exemple le plus caractéristique est sans doute celui de la publicité en ligne. Au départ, les plateformes proposent le plus souvent un service gratuit afin de se constituer une vaste audience auprès des utilisateurs. Une fois cette audience constituée, la plateforme commercialise les données de ses utilisateurs sur le marché de la publicité en ligne. Mais cette valorisation de l’audience peut également prendre la forme de la vente de mots-clés, de l’intéressement, de commissions de rétrocession, etc. Comme le remarque le CNNum, « parfois, la plateforme va plus loin et passe des accords de quasi-exclusivité technique avec certains de ses fournisseurs qui deviennent des partenaires, voire elle devient elle-même un opérateur venant concurrencer directement les entreprises qui étaient auparavant ses clientes » [64].

Adopter une stratégie de plateformisation

Combinés à des rendements d’échelle croissants, les effets de réseau aboutissent rapidement à des situations oligopolistiques, dans lesquelles le vainqueur remporte l’essentiel du marché (“the winner takes all” ou “the winner takes the most”) et d’importantes marges de profits. Pour les acteurs établis, la plateformisation de l’économie prend d’abord la forme d’une menace de désintermédiation. De nouveaux acteurs économiques arrivent et bouleversent les règles du jeu sur leur marché, voire en modifient les frontières. Le phénomène est particulièrement prégnant dans certains secteurs, si l’on veut bien songer à l’industrie culturelle et aux services de streaming, à l’hôtellerie, aux taxis ou encore au transport ferroviaire.

En réaction, de plus en plus d’entreprises issues des secteurs d’activité traditionnels entendent à leur tour se positionner comme des plateformes dans leur secteur d’activité. Le président de Nexity, Alain Dinin, entend ainsi faire de son organisation une plateforme de services de l’immobilier, qui accompagne le client tout au long de sa vie, et sur laquelle des startups viennent se greffer [65]. Guillaume Pepy, le président de la SNCF, va dans le même sens lorsqu’il présente son entreprise comme une plateforme de solutions de mobilité, capable d’agréger différents types de services, du train au VTC, en passant par de la location de voiture, du car ou du covoiturage [66]. Pour une organisation, se positionner comme une plateforme, c’est se positionner comme le réceptacle de données, y compris des données issues de tierces parties, auxquelles d’autres acteurs pourront avoir accès pour créer des services complémentaires. La plateforme qui réussit à s’imposer devient alors le point de passage obligé, un acteur incontournable qui ne peut pas être écarté. Mais comme le rappellent Simon Chignard et Louis-David Benyayer, « il n’y a pas de place pour plusieurs plateformes dans une même arène concurrentielle » [67].

Cependant, contre la tendance oligopolistique, un autre modèle, encore balbutiant, tend à émerger, celui des plateformes de partage, dans lequel plusieurs acteurs économiques coopèrent pour organiser la collecte, la mise en partage et le traitement d’une partie de leurs données. L’objectif de ces plateformes de partage est double. Il s’agit, tout d’abord, d’optimiser la valorisation des données, non seulement en accroissant la quantité et la variété des données disponibles, mais aussi en mutualisant les ressources humaines, techniques et financières nécessaires à leur traitement. Ces plateformes de partage ont aussi une vocation défensive, puisqu’il s’agit en partie d’éviter que la valorisation intervienne uniquement au profit de quelques grands acteurs.

Le secteur agricole est emblématique de cette tension. Des sociétés comme le géant agrochimique Monsanto ou le fabricant de machines agricoles John Deere collectent d’importantes quantités de données sur les exploitations agricoles de leurs clients. Croisées avec d’autres informations, par exemple les conditions météo, ces données peuvent être utilisées pour prodiguer des conseils aux exploitants. Mais elles peuvent également servir à leur vendre des services agricoles complémentaires, voire être directement commercialisées auprès de tiers dont les intérêts ne convergent pas nécessairement avec ceux des agriculteurs : courtiers sur les marchés agricoles, assureurs, fabricants de produits phytosanitaires, etc. Les agriculteurs encourent donc un double risque : celui de se voir dépossédés de la valeur des données qu’ils produisent et celui de voir ces données utilisées contre eux. La révision des modalités contractuelles, ainsi que la mise en place de plateformes de partage des données agricoles accessibles aux contributeurs et aux partenaires que ceux-ci auront choisi, font partie des solutions choisies dans le secteur [68].

Les collaborations peuvent prendre place entre des acteurs qui sont en concurrence sur les marchés, comme l’illustre le rachat du service de navigation HERE par les constructeurs automobiles allemands Volkswagen, BMW et Mercedes. Avec ce rachat, les industriels allemands créent une plateforme commune de connectivité et de navigation qui entend être une alternative crédible à Google Maps. L’enjeu pour les constructeurs est de garder la main sur les données de leurs véhicules et les données de leurs clients, qui constituent des ressources vitales dans la course au véhicule autonome. Les collaborations peuvent également se faire au sein d’une même filière [69], avec des acteurs situés en différents points de la chaîne de valeur.

Ces initiatives témoignent d’une prise de conscience que la valeur des données passe par leur mise en partage et leur circulation. Mais mutualiser des données, en les regroupant dans un pot commun, n’est pas, en soi, une promesse de création de valeur. Là où les plateformes extraient de la valeur, c’est dans l’agrégation, l’enrichissement, le croisement, le traitement des données et dans leur restitution sous forme de services à valeur ajoutée pour les tiers. Que ce soit pour l’industrie automobile ou pour la filière agricole, la mise en partage de données doit s’accompagner d’une véritable stratégie de valorisation des données, laquelle passe par la définition d’objectifs précis, le développement de partenariats avec des acteurs tiers et la conception d’offres de services innovants. C’est seulement de cette manière que la plateforme peut s’imposer comme un lieu de création de valeur et attirer de nouvelles données et de nouveaux partenaires.

Les plateformes de partage sont également confrontées au problème de la répartition de la valeur entre les fournisseurs de données, les utilisateurs et la plateforme elle-même. Le sujet est loin d’être simple, d’autant que la mise en place d’une plateforme et sa gestion exigent d’importants investissements [70]. C’est pourquoi dans certains secteurs l’intervention de l’État peut accompagner le mouvement de plateformisation. À ce titre, la stratégie nationale d’intelligence artificielle a identifié quatre secteurs prioritaires pour la mise en commun de données : la santé, la mobilité, l’environnement et la sécurité.

Quel rôle pour les acteurs publics dans ces écosystèmes ?

L’État, et plus globalement l’administration, a un rôle clé à jouer dans l’organisation et l’animation des écosystèmes des données. Cette dernière est à la fois productrice et utilisatrice de données, et il lui appartient de fixer le cadre réglementaire applicable aux données, à leur circulation et à leur utilisation. Elle pourrait par exemple mettre en place des mesures incitatives ou se positionner comme « État tiers de confiance ».

L’Open Data, vecteur d’enrichissement des écosystèmes

Au sens large, l’Open Data désigne une démarche d’ouverture des données qui n’est pas limitée aux organismes publics [71]. En France, l’expression est généralement utilisée dans un sens plus restreint pour désigner le mouvement d’ouverture des données publiques.

Les administrations sont traditionnellement de très importantes productrices de données. La statistique publique, les enquêtes publiques, le cadastre, les bases topographiques, les circulaires, les registres d’état civil et des sociétés sont des instruments sur lesquels s’appuient classiquement les autorités publiques pour mener à bien leurs missions. Cependant, pour des administrations qui ont longtemps fonctionné dans la culture du secret, la diffusion de ces informations au public, qui plus est sous un format exploitable pour un traitement informatique, ne va pas de soi. Selon les mots de l’ancien administrateur général des données, Henri Verdier, « jusqu’à une date récente, la situation était relativement paradoxale. D’un côté, les grands producteurs de données, opérateurs ou services d’administration centrale, monétisaient leurs données (via des redevances) auprès d’une poignée d’acteurs économiques. De l’autre, l’exploitation de la très grande majorité des données était limitée à l’administration qui les produisait ou les collectait, entraînant ainsi une perte d’opportunité » [72].

Depuis la fin des années 2000, s’appuyant sur les possibilités offertes par les nouvelles technologies, de nombreux gouvernements et des collectivités locales se sont engagés dans une démarche d’ouverture de données publiques. Les objectifs poursuivis par les politiques d’Open Data sont de deux sortes.

En premier lieu, l’ouverture des données publiques revêt une dimension éminemment démocratique : la transparence de l’action publique qui permet aux citoyens de juger de l’action de leurs gouvernants. Le principe de redevabilité est inhérent au fonctionnement de tout système démocratique et on peut le trouver exprimé à l’article 15 de la Déclaration des droits de l’homme et du citoyen de 1789 : « la société a droit de demander compte à tout agent public de son administration ». Afin de pouvoir exercer un contrôle sur l’action des gouvernants et sur l’utilisation de l’argent public, les citoyens et leurs représentants doivent pouvoir accéder à une information transparente sur l’activité des autorités publiques et des élus.

En second lieu, l’ouverture des données publiques est un instrument au service de l’innovation et du développement économique. En mettant ses données à disposition du public, l’administration entend encourager leur réutilisation par des tiers en dehors de leur vocation d’origine. L’ouverture permet d’explorer et de révéler la valeur des données à travers la création de nouveaux services : des services marchands ou non marchands et des services venant enrichir les services publics existants. Cette ouverture constitue désormais un pan de la stratégie française pour l’intelligence artificielle : rendre disponibles d’importantes quantités de données (publiques ou privées) pour entraîner les algorithmes du machine learning et du deep learning.

Aujourd’hui, le cadre juridique français est très complet. Il s’articule autour de trois grands principes : l’accès et la diffusion des documents administratifs, le principe de réutilisation et le principe de gratuité.

Un acte important de l’ouverture des données publiques en France est la loi dite « loi CADA » de 1978, du nom de la commission qu’elle a instituée (Commission d’accès aux documents administratifs) [73]. Elle instaure un droit d’accès aux informations produites par les administrations dans le cadre d’une mission de service public. Le droit d’accès a par la suite été enrichi par de nombreux textes qui sont progressivement venus étendre le périmètre de l’ouverture et qui ont complété le droit d’accès par un droit à la réutilisation des données publiques. Avec l’arrivée d’Internet, la question de l’accès aux documents administratifs change de nature.

Désormais, l’enjeu n’est plus seulement de garantir l’accessibilité dans le cadre de requêtes individuelles, mais de mettre à disposition du public les données de l’administration de manière permanente.

La loi pour une République numérique de 2016 est venue consacrer le principe de l’accès par défaut aux informations administratives. Elle crée l’obligation pour les organisations publiques et pour les collectivités territoriales de plus de 3 500 habitants de publier sur Internet leurs bases de données dans un standard ouvert et aisément réutilisable. Par ailleurs, elle introduit dans le droit la notion de données d’intérêt général, qui impose l’ouverture des données détenues par les acteurs privés délégataires d’une mission de service public ou qui bénéficient de subventions publiques. L’ouverture de ces données permet aux autorités publiques de contrôler l’activité des délégataires et de partager l’information avec eux.

La valeur économique et sociale qui peut être créée par la mise à disposition à titre gratuit des données publiques est bien supérieure à la valeur que l’État pourrait tirer de leur vente [74]. La gratuité augmente les chances de réutilisation des données publiques en réduisant le coût des usages commerciaux et en permettant le développement d’usages non commerciaux qui n’auraient pas été possibles si l’accès aux données avait été payant. Elle permet à des entreprises de taille modeste, et même à l’administration, d’utiliser des données auxquelles elles n’auraient pas eu accès si elles avaient dû payer pour les acquérir.

La disponibilité des données est un élément essentiel de l’Open Data, mais ce n’est pas le seul. Il faut encore que les données soient accessibles et, pour un objectif démocratique, simples à comprendre par les tiers. Le format utilisé pour la publication des données, mais aussi l’interface qui permet d’y accéder, sont des éléments fondamentaux des politiques d’ouverture des données publiques.

En 2011, la création de la mission Etalab, service du secrétariat général à la modernisation de l’État chargé de coordonner la politique d’ouverture et de partage des données publiques, marque une étape importante. Etalab administre la plateforme data.gouv.fr qui réunit et met à disposition librement l’ensemble des données publiques de l’État et de ses établissements publics. Si elles le souhaitent, les collectivités territoriales et les personnes de droit public ou de droit privé chargées d’une mission

de service public peuvent également utiliser cette plateforme. Début 2019, le site annonçait mettre à disposition 36 034 jeux de données et 1915 réutilisations au-delà de leur utilisation première par l’administration. L’une des originalités de la plateforme est de permettre aux usagers d’enrichir et d’améliorer les données disponibles, et également d’en déposer de nouvelles, dans une logique contributive. Par exemple, Blablacar a utilisé le portail pour partager le fichier des aires de parking de covoiturage qu’il avait constitué. Cette logique de co-construction s’étend aux données produites par les citoyens, notamment les associations comme Open Street Map, Open Météo Foundation, Open Food Facts, etc.

Le service public de la donnée

L’article 14 de la loi pour une République numérique crée un service public de la donnée dont la gouvernance a été confiée à la mission Etalab. Celui-ci vise à mettre à disposition, en vue de faciliter leur réutilisation, les jeux de données de référence qui ont le plus fort impact économique et social, et dont la qualité de mise à disposition est critique pour les utilisateurs. À ce jour, neuf jeux de données ont été identifiés comme des données de référence : le répertoire des entreprises et des établissements (base Sirene), le répertoire national des associations (RNA), le plan cadastral informatisé (Cadastre), le registre parcellaire graphique (RPG), le référentiel à grande échelle (RGE), la base adresse nationale (BAN), le répertoire opérationnel des métiers et des emplois (ROME), le référentiel de l’organisation administrative de l’État, et le code officiel géographique (COG)

Les données d’intérêt général : du constat partagé aux difficultés de mise en oeuvre

Les écosystèmes des données peuvent également être enrichis par l’ouverture de jeux de données détenus par des organismes privés. Si cette ouverture peut produire de nombreuses externalités positives pour la collectivité, les détenteurs de données ne sont pas toujours enclins à partager des données qui leur procurent un avantage concurrentiel ou qu’ils entendent exploiter eux-mêmes. Leur intérêt économique peut même être, au contraire, de garder pour eux certaines données, ou de ne les partager qu’avec les partenaires qu’ils auront. Face à ce paradoxe, l’État a engagé une réflexion sur la définition d’une nouvelle catégorie juridique de données : « les données d’intérêt général », une catégorie de données privées dont l’ouverture pourrait être imposée par la loi pour des motifs d’intérêt général [75].

L’origine du sujet remonte à 2015 et à la prise de conscience qu’il manquait un outil juridique pour accéder à des données de transport qui ne sont pas produites par une autorité publique ou dans le cadre de délégations de services publics, mais qui n’en participent pas moins de l’intérêt public. Par exemple, une Ville comme Paris peut accéder aux données de mobilité de la RATP et des délégations de services publics, mais pas aux données produites par le secteur privé, qui représentent une part essentielle des données de mobilité sur son territoire : les taxis, les VTC, les trottinettes électriques, les deux-roues en libre-service, le covoiturage ou encore les applications de navigation GPS comme Waze ou Google Maps. Pourtant, l’ouverture de ces données présenterait des avantages certains. La Ville pourrait s’appuyer sur une meilleure connaissance des flux de circulation sur son territoire pour réorienter son offre de transport public et décider de nouveaux aménagements dans l’espace public. Les usagers seraient en mesure d’identifier les différentes offres de transport disponibles pour effectuer un même trajet. La disponibilité de ces données pourrait susciter la création de services innovants de transport multi-modaux ou d’information des voyageurs (mobility as a service ou MaaS).

En Finlande, pays pionnier dans l’ouverture des données de transport, les opérateurs doivent obligatoirement partager leurs données en temps réel, utiliser des interfaces logicielles ouvertes et donner accès à leur billetterie [76]. À Helsinki, l’application Whim permet d’organiser ses déplacements en vélo libre-service, en métro, en bus, en tramway, en taxi ou en voiture de location. Les utilisateurs peuvent réserver et payer un trajet en un clic, combiner les modes de déplacement et souscrire à des abonnements qui intègrent les différents moyens de transport. Le sujet du MaaS a également émergé en France, notamment dans le cadre de la Loi d’orientation des mobilités, qui contient des mesures visant à favoriser la circulation des données de mobilité.

Le concept de « données d’intérêt général » laisse toutefois plusieurs questions en suspens :

  • Comme pour l’Open Data, une politique d’ouverture des données privées à des fins d’intérêt général peut poursuivre des objectifs qui apparaissent très différents les uns des autres. Les données privées peuvent, tout d’abord, servir à améliorer l’efficacité des politiques publiques en permettant l’adoption de décisions politiques mieux informées. Elles peuvent également, dans une logique de transparence, procurer une meilleure information aux citoyens et aux consommateurs. Enfin, l’accessibilité des données privées est à même de contribuer au développement économique, et cela de diverses manières : en stimulant l’innovation et le développement de nouveaux services, en contribuant à l’essor des travaux sur l’intelligence artificielle ou encore en favorisant la concurrence sur les marchés. Selon la finalité recherchée, la diffusion des données d’intérêt général se fera auprès de différents cercles : les autorités publiques (BtoG, Business to Government), les citoyens (BtoC, Business to Citizens), les entreprises (BtoB, Business to Business) ou l’ensemble des acteurs.
  • Le périmètre de l’ouverture est difficile à déterminer. Il ressort de la réflexion publique sur le sujet que l’adoption d’une loi transversale sur l’ouverture des données privées d’intérêt général n’est ni souhaitable ni possible juridiquement, et qu’il convient plutôt de retenir une approche sectorielle et différenciée selon les données concernées [77]. Le transport, l’emploi, la formation, la santé, l’énergie et la finance constituent ainsi des secteurs clés pour l’ouverture. Au niveau européen, la directive sur les services de paiement (DSP2) impose aux banques de fournir l’accès aux données de leurs clients (avec leur consentement) à des acteurs tiers via des API.
  • Les règles d’accès et de réutilisation des données doivent être établies au cas par cas, selon les données et leur destinataire. Une question qui se pose est notamment de savoir si les entreprises auxquelles on impose de rendre leurs données accessibles à des tiers ont droit à une compensation financière. Dans la mesure où l’ouverture des données privées peut se heurter aux droits de propriété, à la liberté d’entreprendre et au secret industriel et commercial et qu’elle implique des coûts, les détenteurs de données pourraient demander à être rémunérés pour ce service. On peut aussi imaginer que l’accès des autorités publiques à des fins de politiques publiques reste gratuit. Quant aux modalités du partage de données, plusieurs formules sont envisageables : accès aux données directement auprès de leur détenteur ou hébergement des données au sein d’un organisme tiers chargé d’assurer leur circulation, création d’un organe de règlement des différends pour régler les conflits relatifs au partage, etc.

Notons que plusieurs acteurs numériques se sont engagés ces dernières années dans des politiques d’ouverture volontaire de leurs données. Depuis 2014, le programme Connected Citizens de Waze permet ainsi à des collectivités locales et à certaines entreprises privées d’accéder aux données sur les accidents et les ralentissements signalés par les utilisateurs de l’application ; en échange, ces dernières communiquent à Waze des informations sur les routes fermées, les travaux et les évènements susceptibles de perturber le trafic. Lancé en 2017, Uber Movement permet de connaître le temps de transport entre deux points et d’obtenir des statistiques sur le trafic routier. Enfin, le portail Dataville de Airbnb permet aux collectivités d’accéder aux données de la plateforme concernant le nombre d’annonces sur leur territoire, le nombre de voyageurs accueillis, les pays d’origine des voyageurs et le revenu annuel médian d’un hôte, et d’enrichir ainsi leur connaissance de l’activité touristique de leur territoire.

Dans ce type de démarche, les entreprises choisissent les informations qu’elles rendent disponibles et leur niveau de granularité, les modalités d’accès aux données concernées (Waze et Uber demandent une inscription préalable) et elles en fixent les conditions d’utilisation (Uber refuse tout usage commercial ; Waze refuse que les données diffusées soient partagées avec des tiers).

L’État, moteur de la plateformisation des secteurs

L’État peut adopter des mesures réglementaires ou incitatives pour faciliter la rencontre et encourager le partage entre les organisations qui détiennent les données et les organisations qui recherchent des données pour développer leur activité. Sans imposer l’ouverture, les politiques publiques peuvent s’attaquer aux freins techniques, culturels et juridiques au partage.

Les organismes publics détenteurs de données peuvent être frileux à l’idée d’offrir un accès à leurs données, d’autant plus qu’ils ne perçoivent pas nécessairement les bénéfices qu’ils peuvent en retirer. Ils peuvent notamment craindre de se dessaisir d’un actif stratégique, ou que cette ouverture ne les place en situation de violation de la législation sur la protection des données. À ce titre, la Cour des comptes a publié, le 11 mars 2019, un référé portant sur l’ouverture et la valorisation des données dans trois établissements publics (IGN, Météo France et Cerema) concernés, à des degrés divers, par l’obligation de gratuité de l’Open Data. Pour la Cour des comptes, ces acteurs sont « confrontés à des difficultés de mise en oeuvre des dispositions légales relatives à l’ouverture des données ; d’autre part, ils voient leur modèle économique remis en cause, particulièrement I’IGN ». Dans sa réponse à ce référé, le Premier Ministre indique avoir demandé à « l’Inspection Générale des Finances, avec l’appui, le cas échéant, de la Direction interministérielle du numérique et des systèmes d’information et de communication de l’État (DINSIC) qui pilote au niveau interministériel la politique d’ouverture des données et le service public de mise à disposition des données de référence, d’établir sous six mois un premier bilan de la mise en oeuvre de l’ouverture des données et de ses impacts, des difficultés rencontrées par les ministères et leurs opérateurs et de proposer les mesures d’accompagnement adaptées. »

Par ailleurs, les données produites doivent l’être suivant des formats standards pour pouvoir être agrégées avec des données de sources tierces et donc utilement partageables. Comment garantir aux organisations qui investissent aujourd’hui dans des systèmes d’information lourds et coûteux que ces derniers sont interopérables avec ceux de leurs homologues, au sein de mêmes filières ? De plus, même lorsque deux organisations sont désireuses de partager des données, elles ne disposent pas toujours du savoir-faire nécessaire pour conclure un accord et organiser le partage en pratique.

Pour aider les acteurs concernés à investir dans des systèmes capables d’assurer l’interopérabilité requise, l’État pourrait flécher les aides en matière d’investissement, par exemple au travers de labels, sur la base d’un cahier des charges en matière d’interopérabilité, tant technique que sémantique.

Dans un rapport remis au gouvernement britannique en 2017, Dame Wendy Hall et Jérôme Pesenti identifient deux leviers à même de favoriser l’accès, la circulation et le partage des données privées. Une première manière pourrait prendre la forme de l’établissement de lignes directrices et de contrats types. À l’heure actuelle, les coûts de transaction pour la conclusion d’accords entre deux organisations sont élevés, ce qui rend leur conclusion difficile pour de petits acteurs.

L’établissement de contrats types pourrait faciliter l’accès aux données de plus petites structures en réduisant leurs coûts de transaction. Mais il pourrait également contribuer à supprimer les réserves au partage des détenteurs de données en garantissant le caractère équitable et sécurisé de l’échange. C’est là un des points clés issus des auditions menées par les préfigurateurs du Health Data Hub : la difficulté pour les start-ups innovantes du secteur des données de santé à se développer en France, l’établissement de contrats d’accès aux données nécessaires pour mettre au point et entraîner leurs algorithmes devant se faire auprès de chaque établissement hospitalier individuellement. Une des missions du Health Data Hub sera de fournir une assistance sous la forme d’expertise de valorisation et de modèles de contrat pour faciliter les négociations et garantir un accès effectif aux données dans des délais raisonnables et annoncés. Dans le secteur de l’agriculture, ce sont les acteurs eux-mêmes, notamment par le biais des filières, qui commencent à établir des modèles de contrat encadrant le partage des données.

En second lieu, le rapport Hall-Pesenti préconise la création de « data trusts » qui sont peu ou prou l’équivalent des « plateformes de mutualisation sectorielle » recommandées par la mission Villani relative à la stratégie nationale de la France sur l’IA. Ces organismes joueraient le rôle de tiers de confiance entre les parties qui souhaitent s’engager dans un partage de données et les potentiels réutilisateurs. La question de leur forme juridique (nomment publique ou privée) et de leur modèle économique reste ouverte. Ces organismes seraient notamment en charge de fixer un cadre à l’échange de données et de promouvoir les bonnes pratiques. Ils pourraient aider les parties à s’accorder sur les données partagées, ainsi que sur les conditions de transfert, de stockage, d’accès et d’utilisation ou encore sur la répartition de la valeur générée par leur utilisation. Ces tiers de confiance pourraient encore aider les parties à évaluer la valeur de leurs données, fixer des lignes directrices sur l’anonymisation et la sécurisation des données ou délivrer des conseils sur le respect de la réglementation en vigueur (notamment le RGPD). Ainsi, ils pourraient porter toutes mesures à même de favoriser le partage entre organisations et de renforcer la confiance des utilisateurs.

L’intervention publique dans ces plateformes de partage de données sectorielles n’est justifiée que si ce service apporte des garanties supplémentaires aux fournisseurs et aux utilisateurs de données, ou parce qu’il intervient dans des domaines dans lesquels il existe une carence de l’initiative privée.

En France, le projet de « Health Data Hub » ouvre la voie à la création de plateformes de partage de données pilotées par les autorités publiques [78], en lien et en coordination avec l’ensemble des acteurs du secteur. À ce titre, il témoigne également de la difficulté de la mise en oeuvre de ces structures et de leur gouvernance. Le Health Data Hub est destiné à faciliter l’accès et la réutilisation par des tiers des nombreux jeux de données de santé produits dans le cadre des soins, au-delà des données médico-économiques de l’Assurance Maladie. Il devrait prendre la forme d’un guichet unique permettant aux porteurs de projets présentant un intérêt public d’accéder aux données de santé via une plateforme sécurisée. Le groupement d’intérêt public (GIP) Health Data Hub aura pour mission de faire émerger et d’animer un écosystème autour des données de santé :

  • en accompagnant les producteurs de données de santé dans la collecte et l’amélioration de la qualité des données ;
  • en aidant les utilisateurs à comprendre quelles sont les données disponibles et leur potentielle valorisation ;
  • en assurant la mise en relation des producteurs et des utilisateurs publics et privés selon un processus standardisé ;
  • en mettant à disposition des utilisateurs des ressources technologiques et humaines mutualisées.

À la suite des conclusions de la mission Villani, la France a également lancé fin 2018 un Appel à Manifestation d’Intérêt sur la mutualisation des données au sein de plateformes sectorielles ou cross-sectorielles. L’État entend favoriser la constitution de grandes bases de données mutualisées susceptibles de servir au développement de l’IA. L’intervention de l’État prendra la forme d’un soutien financier à des opérations souvent consommatrices de temps et de ressources humaines et financières, telles que l’enrichissement des jeux de données, l’annotation des données, le développement d’interfaces techniques ou le développement d’outils de gestion technique et de facturation.

Des initiatives de partage de données voient également le jour au niveau local. Des projets comme DECODE (DEcentralised Citizen-owned Data Ecosystems) à Barcelone et à Amsterdam et Mes.Infos à Lyon, Rennes et La Rochelle cherchent à initier de nouvelles formes de partage des données entre les citoyens et leur collectivité. Les citoyens acceptent de partager leurs données personnelles avec la collectivité pour qu’elles soient utilisées dans la conduite des politiques publiques.

[47] Duchesne Claudine, Cytermann Laurent, Vachey et al. Rapport relatif aux données d’intérêt général, rapport du Conseil général de l’économie, de l’industrie, de l’énergie et des technologies, du Conseil d’État et de l’Inspection général des finances, septembre 2015 ; OCDE, Data-Driven Innovation. Big Data for Growth and Well-Being, op. cit.

[48] Marzloff Bruno, Sans bureau fixe, FYP éditions, 2013.

[49] OCDE, Data-Driven Innovation. Big Data for Growth and Well-Being, op. cit.

[50] Chignard Simon et Benyayer Louis-David, Datanomics, les nouveaux business models des données, op. cit., p. 59.

[51] MedjaouiMehdi, « Les APIs sont les nouveaux contrats du monde numérique », entretien réalisé par Ouishare pour son magazine, 31 juillet 2018. https://www.ouishare.net/article/les-apis-sont-les-nouveaux-contrats-du-monde-numerique?locale=en_us.

[52] Collin Pierre et Colin Nicolas, Mission d’expertise sur la fiscalité de l’économie numérique, rapport pour le ministère de l’Economie et des Finances et le ministère du Redressement productif, 2015, p. 37.

[53] MedjaouiMehdi, « Les APIs sont les nouveaux contrats du monde numérique », art. cit.

[54] Jacque Philippe, « La RATP ouvre (enfin) ses données temps réel », Le Monde, 5 janvier 2017. https://www.lemonde.fr/economie/article/2017/01/05/la-ratp-ouvre-enfin-ses-donnees-temps-reel_5057926_3234.html

[55] Règlement (UE) 2018/1807 du 14 novembre 2018, établissant un cadre applicable au libre flux des données à caractère non personnel dans l’Union européenne.

[56] CNNum, Avis du Conseil national du numérique sur la libre circulation des données en Europe : Fiche sur la consécration d’un droit à la portabilité des données non personnelles, avril 2017 https://cnnumerique.fr/nos-travaux/libre-circulation-des-donnees-en-europe

[57] D’après la définition donnée par Wikipédia : « Un standard est fermé quand le référentiel n’est pas diffusé, ou quand il est soumis à des restrictions d’accès, par exemple si sa mise en oeuvre nécessite le paiement de royalties à cause de brevets, ou si l’octroi de licence sur les brevets est soumis à une acceptation préalable par son éditeur ou si son éditeur impose une clause contractuelle de confidentialité ».

[58] CNNum, Avis du Conseil national du numérique sur la libre circulation des données en Europe, avril 2017, op. cit.

[59] eBay, Amazon Marketplace, ManoMano, Leboncoin, Facebook et YouTube, Google Play et App Store, PayPal, Waze, Airbnb, Blablacar et Uber sont des exemples de plateformes.

[60] https://ec.europa.eu/digital-single-market/en/glossary#Online_Platforms

[61] Isaac Henri , Plateforme et dynamiques concurrentielles, Renaissance Numérique, octobre 2015 http://www.renaissancenumerique.org/publications/plateformes-et-dynamiques-concurrentielles.

[62] Chignard Simon et Benyayer Louis-David, Datanomics, les nouveaux business models des données, op. cit., p. 94.

[63] Isaac Henri, Plateforme et dynamiques concurrentielles, Renaissance Numérique, op. cit.

[64] CNNum, Neutralité des plateformes : Réunir les conditions d’un environnement numérique ouvert et soutenable, mai 2014, p. 83.

[65] Sabbah Catherine, « Nexity va muter en plateforme de services à l’immobilier », Les Échos, 23 janvier 2017, https://www.lesechos.fr/23/01/2017/lesechos.fr/0211721902733_nexity-va-muter-en-plate-forme-de-services-a-l-immobilier.htm

[66] Steinmann Lionel, « Après la réforme, priorité à la plateforme », Les Échos, 8 janvier 2019. https://www.lesechos.fr/idees-debats/editos-analyses/0600468947163-sncf-apres-la-reforme-priorite-a-la-plate-forme-2234521.php

[67] Chignard Simon et Benyayer Louis-David, Datanomics, les nouveaux business models des données, op. cit., p. 87.

[68] Renaissance numérique, La valeur des données en agriculture, février 2018.

[69] En France, voir l’initiative Valdriv** PLM qui réunit les constructeurs et les équipementiers du secteur.

[70] Choukroun Marc-David, « Non, la coopérative n’est pas l’avenir de l’économie collaborative », Les Échos, 29 décembre 2015.https://www.lesechos.fr/29/12/2015/LesEchos/22096-028-ECH_non--la-cooperative-n-est-pas-l-avenir-de-l-economie-collaborative.htm

[71] À ce sujet, voir les travaux de l’Open Data Institute disponibles sur le site Internet de l’organisation : https://theodi.org/

[72] Administrateur général des données, La donnée comme infrastructure essentielle, rapport annuel 2016–2017, p. 15.

[73] Loi n° 78–753 du 17 juillet 1978 portant diverses mesures d’amélioration des relations entre l’administration et le public et diverses dispositions d’ordre administratif, social et fiscal.

[74] Trojette Mohammed Adnène, Ouverture des données publiques. Les exceptions au principe de gratuité sont-elles toutes légitimes ? Rapport au Premier Ministre, juillet 2013 ; OCDE, Council Recommendation for Enhanced Access and More Effective Use of Public Sector Information, 2008.

[75] Duchesne Claudine, Cytermann Laurent, Vachey et al. Rapport relatif aux données d’intérêt général, op. cit. ; Vachey Laurent, Duchesne Claudine, Meyer Marc et al., Les données d’intérêt général : Phase 2, rapport de l’Inspection générale des finances et du Conseil général de l’économie, de l’industrie, de l’énergie et des technologies, mars 2016.

La Commission européenne a également engagé une réflexion sur l’accès aux données du secteur privé à des fins d’intérêt public dans le cadre de la révision de la directive concernant la réutilisation des informations du secteur public. La question sera vraisemblablement à l’agenda de la prochaine Commission. Voir Commission Européenne, « Vers un espace européen commun des données », communication, COM (2018) 232 final, Bruxelles, le 25 avril 2018.

[76] Allix Grégoire, « À Helsinki, une appli permet d’organiser tous ses déplacements en un clic », Le Monde, 13 octobre 2018. https://www.lemonde.fr/economie/article/2018/10/13/a-helsinki-une-appli-permet-d-organiser-tous-ses-deplacements-en-un-clic_5368833_3234. html?xtmc=mobility_as_a_service&xtcr=5

[77] Duchesne Claudine, Cytermann Laurent, Vachey et al. Rapport relatif aux données d’intérêt général, op. cit.

[78] Polton Dominique, Cuggia Marc et Wainrib Gilles, Health Data Hub : Mission de préfiguration, rapport à la ministre des Solidarités et de la Santé, 2018.

--

--