l’Open Data et ses usages
1. Qu’est-ce que l’Open Data ?
Définition
Le terme Open Data ou données ouvertes désigne des données auxquelles n’importe qui peut accéder, que tout le monde peut utiliser ou partager. Leur accès est totalement public et libre de droit, tout comme leur exploitation et réutilisation. Ces données offrent de nombreuses opportunités pour étendre le savoir humain et créer de nouveaux produits et services de qualité.
Ses critères
Selon l’Open Knowledge Foundation (l’association fondée en 2004 à but non lucratif de droit britannique promouvant la culture libre, en particulier les contenus libres et les données ouvertes), l’Open Data possède trois critères essentiels :
- La disponibilité et l’accès : ce premier critère indique que les données doivent être pleinement accessibles et de préférence, elles se téléchargent sur Internet.
- La réutilisation et la redistribution : ce second critère précise que les données doivent être fournies d’une façon précise, afin de permettre leur réutilisation et leur redistribution (en incluant le mélange avec d’autres ensembles de données).
- La participation universelle : ce troisième et dernier critère insiste sur le fait que tout le monde peut utiliser, réutiliser et redistribuer les données et il ne doit y avoir aucune discrimination envers des personnes, des groupes ou concernant les fins d’utilisation (commerciales ou non, restrictions d’usage à certains secteurs etc.).
L’interopérabilité, un concept essentiel à l’Open Data
Ces trois critères sont l’essence de l’Open Data, car ils autorisent l’interopérabilité. Celle-ci se définit par la capacité de différentes entreprises ou systèmes à travailler ensemble et à mélanger différents ensembles de données.
Elle est donc essentielle pour tirer des bénéfices grâce à l’ouverture de ces données puisqu’il est ensuite possible de développer des produits et des services en plus grande quantité et d’une meilleure qualité.
Pour permettre cette interopérabilité, il faut que les jeux de données utilisent un langage de programmation commun ou qu’un élément de programmation fasse l’intermédiaire entre ces informations. Ainsi, afin de répondre à ce besoin de communication, le W3C (World Wide Web Consortium) à mis au point des standards de l’Open Data, en facilitant le classement et la recherche de données par l’utilisation du langage Web sémantique.
Cependant, le créateur de la donnée doit dans ce cas respecter quelques critères particuliers : il doit indiquer la date et l’heure de création, certifier la provenance de la donnée, garantir la qualité de l’information et si possible son auteur, etc.
Tous les secteurs sont concernés par l’Open Data
L’Open Data peut s’appliquer à des informations en provenance de n’importe quelle source, sur n’importe quel sujet. Ainsi, tout le monde peut proposer des données sous licence ouverte pour un usage gratuit afin que le public en tire un bénéfice.
Les données ouvertes proviennent généralement du gouvernement et du secteur public : il s’agit la plupart du temps de cartes, de budgets, ou de résultats découlant de recherches scientifiques. Cependant, les entreprises, les universités, les ONG, les startups, les fondations caritatives, les communautés ou les individus peuvent également proposer des Open Data.
On retrouve également des informations ouvertes dans les secteurs de la science, des produits, de l’éducation, de l’environnement, de la cartographie, des bibliothèques, de l’économie, de la culture, du développement, des affaires, du design ou de la finance. Le terme s’applique aussi aux données et contenus comme les images, le texte et la musique.
Open Definition : une ouverture légale et technique
Advisory Council gouverne depuis 2007 l’Open Definition. Ce groupe maintient et développe la définition officielle des données ouvertes et étend l’Open Definition pour le bénéfice général de la communauté. Ainsi, il décide des licences qui entrent dans le cadre de l’Open Definition.
Selon l’Open Definition, les Open Data sont légalement et techniquement ouvertes.
L’ouverture légale signifie que l’accès aux données est légal, tout comme l’exploitation, le partage et la modification ; et il ne doit y avoir aucune restriction, y compris à des fins commerciales.
Enfin, l’ouverture technique signifie qu’il ne doit y avoir aucune barrière technique et financière à l’utilisation des données : elles doivent donc être pleinement accessibles au format numérique, et téléchargeables sur internet par n’importe qui, peu importe quand, où, etc.
2. Quels sont les usages de l’Open Data ?
Exemples d’utilisation des Open Data :
Il existe plusieurs domaines au sein de l’open data. Parmi eux, nous pouvons compter les Data : transports, géologie, culture, science, économie, statistique, climatique et enfin environnementale.
Geodata :
La Geodata est un système informatique conçu pour capturer, stocker, manipuler, analyser, gérer et présenter tous les types de données géographiques. Le type d’informations au sein de cette Data est illustrée sur cette image (la population, les incidents ainsi que les reliefs etc.)
L’ ING (l’institut National de l’Information Géographique et forestière), donne libre accès à ses données et depuis la fin du premier trimestre 2021, elles sont libres et gratuites.
Transport :
Les Open Data jouent également un rôle dans le domaine des transports. En effet, la seule industrie du transport à Londres est parvenue à dégager un retour sur investissement de 58 pour 1 en ouvrant l’accès à ses données de transport et l’Open Data Institute estime le chiffre d’affaires annuel combiné des entreprises anglaises dirigées par l’Open Data de 92 milliards de Livres Sterling. L’objectif était d’aider des leaders mondiaux, comme « Citymapper », à voir le jour. Cette application mobile révolutionnaire, comme de nombreuses autres, est née grâce à l’ouverture des données.
Un exemple local de création de service grâce à l’utilisation des Open Data est l’application « Nantes dans ma poche ». Accessible à tous localement, cette application centralise de nombreuses données d’open data autour de la ville de Nantes dont les transports, la circulation, mais aussi la possibilité d’enregistrer des arrêts de bus/tram près de chez nous et recevoir ensuite des alertes sur les horaires de passages de ces derniers, savoir quand passera le prochain etc.
Culture :
Les données ouvertes dans le domaine de la culture et de l’enseignement sont importantes pour les gouvernements eux-mêmes. Elles permettent par exemple d’améliorer l’efficacité du gouvernement et de favoriser l’accès à la connaissance partout dans le monde. Elles sont très utiles pour les pays pauvres qui souffrent de retard en matière d’éducative.
Le Ministère de l’Education Hollandais a par exemple publié toutes ses données relatives à l’éducation sur Internet. De cette manière, le nombre de questions reçues par le ministère a diminué, ce qui a permis de réduire la charge de travail et les coûts.
En France le gouvernement développe ainsi le site data.gouv.fr qui regroupe l’ensemble des données publiques. Le site data.eductation.gouv.fr met à disposition une grande quantité de données concernants la culture et l’éducation.
Science :
La Data Science combine plusieurs domaines, dont les statistiques, les méthodes scientifiques, l’intelligence artificielle (IA), la programmation informatique, l’analyse prédictive, les mathématiques et l’analyse des données, pour extraire de la valeur des données. Grâce à cette extraction d’informations exploitables à partir de données brutes, les Open Data stimulent la recherche à moindre cout en sciences humaines ou expérimentales.
La Data Science a pour but principal d’identifier des tendances, des motifs, et des connexions dans les larges ensembles de données.
Aujourd’hui, la Data Science inclut aussi les algorithmes de Machine Learning. Les méthodes et approches employées peuvent varier d’une organisation à l’autre et il devient donc très compliqué d’offrir une définition précise de la Data Science, notamment parce que les nouvelles technologies apparaissent sans cesse et transforment continuellement ce domaine.
Economie :
La Data est au cœur de l’activité économique. La plateforme data.economie.gouv.fr, est celle des données ouvertes du ministère de l’Économie et des Finances et du ministère de l’Action et des Comptes publics. En naviguant sur ce site gratuit, nous pouvons découvrir une multitude de données comme par exemple : l’agenda de Bruno Le Maire, les plans de relance etc…
Des milliards de dollars circulent quotidiennement sur les marchés mondiaux et les analystes sont chargés de surveiller ces données avec précision, sécurité et rapidité afin d’établir des prévisions, de découvrir de nouveaux modèles. Par ailleurs, les systèmes hérités n’étant pas en mesure de prendre en charge des données non structurées et cloisonnées sans une implication, les analystes adoptent de plus en plus des solutions de données dans le cloud.
Statistiques :
Au niveau de la Data statistique, L’Institut National de la Statistique et des Etudes Economiques (INSEE) collecte des données quantitatives sur la société française : économie, démographie, emploi…
Un exemple est l’Eurométropole de Strasbourg qui a proposé une solution permettant de suivre en direct les élections municipales de 2020 et donc les résultats du premier tour. Cette démarche offrait la possibilité aux élus d’être informés en temps réel et aux journalistes de ré-exploiter les données au sein de leurs médias. Les citoyens du territoire ont pu avoir accès directement à cet outil démocratique. Ces techniques semblent prometteuses pour les prochaines élections présidentielles. Cependant, ces usages ne sont pas sans risques car la numérisation des ses chiffres entraîne un éventuel risque de sabotage, surtout concernant des statistiques au sujet les élections présidentielles.
Climatique :
Une application ou un site que beaucoup de personnes connaissent et utilisent chaque jour correspond à l’Open Data Climatique : il s’agit de Météo-France.
C’est un service météorologique et climatique national et un établissement public de l’Etat. Il joue un rôle opérationnel dans la sécurité météorologique des personnes et des biens, ainsi que d’appui météorologique aux forces armées et, en tant que prestataire désigné par l’Etat, de fournisseur de services météorologiques à la navigation aérienne.
Météo-France joue également un rôle dans l’étude du climat et de ses évolutions en produisant des scénarios de changement climatique et met également ses ressources à la disponibilités des citoyens.
Environnementale :
Enfin, les Open Data ont un lien étroit avec l’environnement, en analysant les données collectées pour mieux comprendre les enjeux qui se posent aujourd’hui.
En effet, elles permettent la réutilisation des données qui ont pu être récoltées en vue d’apporter des solutions aux problèmes qui émergent.
Ainsi, les données ouvertes visent à diffuser différents types d’informations relatives : aux conditions atmosphériques, à la météorologie, à la qualité de l’air (pollution, émission de CO2, gaz à effet de serre), à la température (permettant d’analyser le réchauffement climatique), aux océans, mers, lacs, fleuves (qualité de l’eau, niveau de l’eau pour mesurer par exemple la fonte des glaces), aux sols (pollution, érosion, végétation) ou encore à la biodiversité.
3. Les résultats des données ouvertes
Des bénéfices à toutes les échelles
L’Open Data permet d’améliorer le quotidien socialement, financièrement, culturellement et plus encore. Elle permet au monde de fonctionner collectivement, de découvrir plus rapidement et mettre en commun des statistiques mondiales, comme par exemple durant la crise du Covid 19. Par ailleurs, elle offre l’opportunité d’accéder plus facilement aux services de santé, à mieux comprendre les gouvernements, mais aussi à voyager plus aisément. Finalement, de nouvelles possibilités sont découvertes en permanence.
En effet, lorsque de grandes entreprises ou des gouvernements ouvrent l’accès à des données non-personnelles, cela permet aux petites entreprises, aux citoyens et aux chercheurs de développer des ressources offrant des améliorations cruciales pour leurs communautés.
4. Les inquiétudes et confusions autour de l’Open Data
Aujourd’hui, beaucoup de personnes sont angoissées par la notion d’Open Data. Le fait que les données médicales personnelles soient accessibles en Open Data est par exemple une source d’inquiétude. Cependant, il ne faut pas confondre les données commerciales et les données personnelles et cette confusion explique des inquiétudes parfois injustifiées.
Cette définition confuse pose problème, notamment pour les gouvernements qui créent des lois autour des données. En effet, le terme Open Data ne signifie pas qu’un gouvernement ou qu’une autre entité rend publiques toutes ses données : il serait inconscient de délivrer toutes les données privées et personnelles des citoyens ou des consommateurs à n’importe qui.
De même, le RGPD (Règlement Général sur la Protection des Données), censé assurer la confidentialité des données, semble aller à l’encontre du principe de l’Open Data, visant à mettre l’information à disposition de tous. De fait, les deux concepts pourraient sembler incompatibles.
Cependant, la législation française a anticipé l’entrée en vigueur du RGPD. Ainsi, la loi Lemaire et l’article L.312–1–2 du Code des relations entre le public et l’administration aux collectivités a permis de mettre à disposition l’ensemble des informations concernant le public, mais uniquement en rendant au préalable impossible l’identification des personnes concernées par ces données personnelles.
En réalité, Open Data signifie donc que les données sont rendues publiques d’une manière spécifique et en règle générale, les Open Data sont uniquement des données non personnelles : c’est-à-dire qu’elles ne comportent aucune information sur des individus, pour des raisons évidentes de respect de la vie privée.
Cette mauvaise compréhension provoque naturellement la crainte concernant la confidentialité mais les gouvernements doivent proposer les données d’une manière permettant d’assurer un accès égal par tous les citoyens et de manière sécurisée.
Conclusion
Pour conclure, l’Open Data désigne toutes les données auxquelles tout le monde peut accéder, utiliser et partager. Ainsi, les gouvernements, les entreprises et les individus peuvent utiliser l’open data afin de créer des avantages sociaux, économiques et environnementaux.
Malgré les problèmes engendrés par la confusion entre données publiques et données ouvertes et les difficultés liées à l’établissement d’une définition précise et universelle de l’Open Data, les données ouvertes ont d’ores et déjà permis d’étendre considérablement le savoir et les connaissances.
Enfin, les bénéfices ne se limitent pas à l’exploitation de la donnée. En effet, l’Open Data est une réelle opportunité de développement pour les entreprises : les données mises à disposition peuvent sembler ne pas être exploitables au premier abord mais elles peuvent le devenir si elles sont complétées par d’autres, ce qui donne l’opportunité de nouer des partenariats qui peuvent s’avérer intéressants. L’Open Data favorise ainsi la croissance économique et les entreprises développent de plus en plus de solutions et de logiciels basés sur ce principe.
___________________________________________________________________
Bibliographie :
futura-sciences.com, La Rédaction de Futura, « Open data : qu’est-ce que c’est ?», https://www.futura-sciences.com/tech/definitions/internet-open-data-15502/, consulté en Octobre 2021
-
data.europa.eu, « L’open data, c’est quoi ? », https://data.europa.eu/elearning/fr/module1/#/id/co-01, consulté en Octobre 2021
-
zdnet.fr, Thierry Noisette « Open data: l’IGN libère ses données », 13/12/2020, https://www.zdnet.fr/blogs/l-esprit-libre/open-data-l-ign-libere-ses-donnees-39914791.htm, consulté en Octobre 2021
-
lebigdata.fr, Bastien L, « Open Data définition : qu’est-ce que c’est ? À quoi ça sert ? », 05/11/2019, https://www.lebigdata.fr/open-data-definition, consulté en octobre 2021.
-
theodi.org, « What is ‘open data’ and why should we care? », 3/11/2017, https://theodi.org/article/what-is-open-data-and-why-should-we-care/, consulté en Octobre 2021
-
data.paysdelaloire.fr, https://data.paysdelaloire.fr/pages/home/, consulté en Octobre 2021
-
data.gouv.fr, « Ville de Nantes », https://www.data.gouv.fr/fr/organizations/ville-de-nantes/, consulté en Octobre 2021
-
opendatafrance.net, « Cas de réutilisation », https://www.opendatafrance.net/reutilisations/, consulté en Octobre 2021
-
educalingo.com, « Signification de “geodata” dans le dictionnaire anglais », 11/2021, https://educalingo.com/fr/dic-en/geodata, consulté en octobre 2021.
-
ign.fr, « Observer — Mesurer — Décrire le territoire », mis à jour en 2021, https://www.ign.fr, consulté en octobre 2021.
-
tableau.com, « Qu’est-ce que la culture des données ? », 05/2018, https://www.tableau.com[/fr-fr/why-tableau/data-culture?utm_campaign_id=2019182&utm_campaign=Awareness-BRAND-ALL-ALL-ALLALL&utm_medium=Paid+Search&utm_source=Google+Search&utm_language=FR&utm_country=FRAN], consulté en Octobre 2021
-
data.éducation.gouv.fr, « /», mise à jour perpétuelle, https://data.education.gouv.fr/pages/accueil/, consulté en Octobre 2021
-
data.enseignementsup-recherche.gouv.fr, « /», mise à jour perpétuelle, https://data.enseignementsup-recherche.gouv.fr/pages/home/, consulté en Octobre 2021
-
hypotheses.org, Camille Capelle, « De la visibilité à la médiation : l’open data et ses usages en éducation. Big data et visibilité en ligne : un enjeu pluridisciplinaire de l’économie numérique », 11/201, https://dcultures.hypotheses.org/246, consulté en Octobre 2021
-
lebigdata.fr, Bastien L « Data Science : définition, secteurs d’application et compétences requises pour la science des données », 19/02/2018, https://www.lebigdata.fr/data-science-definition, consulté en Octobre 2021
-
datascientest.com, Bastien L « Data Science : definition, problématiques et cas d’usage », 12/10/2020, https://datascientest.com/data-science-definition, consulté en Octobre 2021.
-
talend.com, « Utiliser le Big Data dans le secteur de la finance », 2021, https://www.talend.com/fr/resources/big-data-finance/, consulté en Octobre 2021
-
insee.fr, Pascal Rivière, « Qu’est-ce qu’une donnée ? », 31/12/2020, https://www.insee.fr/fr/information/5008707?sommaire=5008710, consulté en Octobre 2021
-
donneespubliques.meteofrance.fr, meteofrance, « accueil », mise à jour perpétuelle, https://donneespubliques.meteofrance.fr, consulté en Octobre 2021
___________________________________________________________________
Revue de veille du 18/10/21 par les étudiants du BDes Interaction Design 2e année — Groupe UX2A — animée par Florent MICHEL.
Article rédigé par Oscar BOUISSET et Jeanne BRAMKAMP.
Accéder à la veille de la promotion Design d’interactivité : http://library.lecolededesign.com/shared/MTE5MC44
Pour plus d’information sur la formation :
Instagram : https://www.instagram.com/interaction.lecolededesign
Facebook : https://www.facebook.com/interaction.lecolededesign
Twitter : https://twitter.com/interdsgn
Chaine Vimeo : https://vimeo.com/channels/interdsgn