Bijou en or ou en argent ? Pas de quoi en faire un théorème ! Flore Beaudelin © (Sommé par le tyran de Syracuse, Hieron II, d’établir scientifiquement la composition d’une couronne en or afin de vérifier l’honnêteté de l’orfèvre qui l’avait fabriquée, Archimède releva le défi en mesurant le volume de la couronne par immersion dans l’eau puis en la pesant afin de comparer sa masse volumique à celle de l’or massif).

Past is prologue

Le premier d’une série d’articles explorant le passé de la data pour mieux en éclairer l’avenir.

Administrations, entreprises ou particuliers, nous produisons chaque jour une quantité incalculable de données. Que celles-ci prennent la forme de chiffres, de textes, de photographies, de videos, de formes ou de sons, nous en produisons chaque jour, à profusion, par des gestes souvent aussi anodins que le simple envoi d’un SMS. Nous produisons de la donnée, quotidiennement, avec ou sans effort, tout comme Monsieur Jourdain faisait de la prose sans le savoir.

Si l’idée du caractère polymorphe des données s’impose assez naturellement, il convient d’insister en revanche sur la définition de leur nature, ne serait-ce que pour en souligner la valeur. « Une donnée est une description élémentaire (…) d’une réalité. C’est par exemple une observation ou une mesure. À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens. En comprenant le sens de l’information, nous aboutissons à des connaissances (…). » [i]

En retenant le principe que les données sont de la connaissance, non encore raffinée, nous comprenons d’autant mieux qu’elles soient à la source même de la réussite des plus grands acteurs de l’économie contemporaine. Nous percevons simultanément et d’autant plus le préjudice représenté par leur perte ou par l’incapacité à les identifier ou les localiser, ce qui factuellement revient exactement au même.

Nous pouvons retrouver cette conscience aigüe et lointaine de perte irrémédiable dans la persistance du mythe, plus ou moins fondé, de l’incendie de la bibliothèque d’Alexandrie ou encore dans la popularité du proverbe à l’origine incertaine : un vieillard qui meurt, c’est une bibliothèque qui brûle. Ajoutons ici la poétique nostalgie pour des livres qui auraient pu être mais n’ont pas été.[ii]

Aussi, la préservation du savoir, sa structuration comme son partage, ont un passé, une histoire, de l’évolution technique de sa conservation (pierre, argile, papyrus, parchemin, papier, disquette, CD-ROM, serveurs, cloud…) à sa structuration (encyclopédies, dictionnaires, Wiktionnaires, archives, bibliothèques…) jusqu’à l’apparition de nomenclatures et d’algorithmes destinés à le classer, le localiser et l’exploiter (Dewey, CDU, moteurs de recherches, IA…). Une histoire, des acteurs et même des penseurs que nous essaierons de mettre en lumière à notre façon dans les prochains mois, au fil des lectures que nous vous proposerons.

Nous ferons également un peu de prospective, en gageant tout particulièrement que le développement de la collective intelligence autorisera à écrire un nouvel épisode, passionnant et inattendu, de cette longue histoire. Un développement prometteur qui pourrait bien illustrer une fois encore la pertinence et l’éternelle jeunesse de la devise s’affichant sans complexe sur la façade à l’antique des National Archives de Washington D.C. : 
What is past is prologue.[iii]

[i] Sciences des données : leçon inaugurale au Collège de France prononcée le jeudi 8 mars 2012, Serge Abiteboul.

[ii] Le livre des livres perdus, Giorgio Van Straten, Actes Sud, 2017.

[iii] Citation tirée de La tempête, Acte II, Scène I, William Shakespeare.