Ontologie de la Data

En quoi les datas peuvent-elles être utiles à la Philosophie ?

Il faudrait pour se faire, avoir des datas sur le matériau de la Philosophie. Quel est-il ? Quelle est la matière du travail du Philosophe ? Où se situe précisément le travail, l’acte intellectuel philosophique ? A priori, on serait tenter de dire que la Philosophie travaille à partir de concepts, c’est-à-dire d’objets idéels et donc immatériels.

Existent-ils des datas philosophiques ? Peut-on transformer des idées en pièces d’informations composées de 0 et de 1 et manipulables par les outils informatiques?

La question n’est pas évidente. Pour adresser cette question, il s’agit de distinguer deux caractères distincts du concept.

Premièrement, le concept est immatériel.

Il n’est pas doté de matérialité, on ne peut pas montrer de la matière et dire : « voilà, ceci est le concept». Tout au plus on peut s’appuyer sur la matérialité du langage (écrite et orale), tout en reconnaissant la distance qui existe entre le mot et l’idée. Le concept n’existe que dans le fonctionnement de l’esprit, dans la psyché. Il se pourrait néanmoins que la matérialité du concept puisse se trouver dans le cerveau, mais les avancées de le recherche en neurologie ne permettent pour le moment pas de l’isoler clairement.

Or, nous sommes confrontés à un premier problème ici, puisque la production de data requiert de la matérialité. Par exemple, on peut organiser le trafic urbain en évaluant le nombre de voiture en circulation. Il est possible d’obtenir ces données par plusieurs procédés, mais celle qui paraît être la plus efficiente est celle utilisée par Google Maps actuellement : utiliser les données gps des smartphones, qui indiquent le positionnement des conducteurs. En revanche, il est plus difficile de chercher une quelconque forme de matérialité pour approcher des concepts. A la question de savoir comment l’individu se réfère au Dasein, il n’y a a priori pas de traces qui puissent potentiellement être numérisée et constituer de la data. La question de l’immatérialité semble donc poser problème ici, puisqu’il paraît difficile (pour le moment) de placer des capteurs dans le cerveau qui soient capables de produire des données sur nos pensées, en les traduisant dans des formats qui permettent à la fois leur stockage et leur analyse.

Cependant, il serait erroné de croire que l’immatérialité est une barrière absolue à la production de datas. Bien au contraire, l’une des révolutions épistémologiques de la mondanité numérique et en particulier son sous-champ des datas est précisément la production d’information sur de l’immatériel. L’immatériel devient informable. Il est possible de donner forme et tangibilité à des objets dont l’ontologie est l’immatérialité. Il s’agit d’une dimension de la phénoménologie numérique habituellement négligée, au profit d’une compréhension des datas qui porte sur de la matière, et ce plus encore alors que l’Internet des Objets est sur le point de transformer notre expérience. Bien sûr, placer des capteurs dans une maison pour évaluer et régler la température et donc obtenir une consommation d’énergie plus fine est intéressante. Néanmoins, la rupture épistémologique se situe bien davantage dans la production de données sur de l’immatériel, autrement dit sur de l’humain.

Pour prendre un exemple d’immatérialité transformée en data, on peut se pencher sur la question des émotions.

Qu’est-ce qu’une émotion ? Comment peut-on l’évaluer, la réifier et en faire un matériau susceptible d’être analysé par des algorithmes ?

La définition que Wikipedia donne de l’émotion est la suivante : « une expérience psychophysiologique complexe de l’état d’esprit d’un individu lorsqu’il réagit aux influences biochimiques (interne) et environnementales (externe) ». La difficulté vient ici du fait que s’il est possible de mesurer des « influences biochimiques » -en quantifiant l’organisme, ce qui est représenté par le versant quantified self de la technologie numérique-, et qu’il est aussi possible de mesurer des « influences environnementales » -en évaluant un certain nombre de paramètres qui entourent le sujet (luminosité, humidité, environnement social, sonores, etc…)-, l’alchimie des deux, elle, est difficilement mesurable, parce qu’il s’agit de vie pure, et que celle-ci n’est pas matérielle, mais est en l’individu, ou plutôt est l’individu.

Comment le numérique est-il parvenu à approcher cette anthropo data ?

Pour répondre à la question du comment, il suffit de se plonger dans le numérique, c’est-a-dire dans l’interaction entre l’homme et des machines informatiques reliées entre elles par Internet, selon la définition donnée par Milad Doueihi. Qu’est-ce qu’on y trouve ?

Dans le monde physique (qu’on peut à défaut de terminologie établie, aussi appeler monde alpha, matériel ou analogique, mais non monde réel comme couple dichotomique avec le numérique « virtuel »), nous sommes habitués à lire les émotions et à en faire un support de nos normes et valeurs et de nos interactions sociales. Nous savons reconnaître sur un visage, dans une démarche, dans le ton de la voix, dans l’intensité du regard, des marqueurs d’émotion qui nous renseignent sur quoi faire et comment interagir. Il serait naïf de croire que parce que le corps n’est pas engagé directement, totalement, pleinement dans le numérique, le support principal des émotions disparaît, et qu’alors, le monde numérique (au sens de mondanité tel qu’approché par Heidegger) est dénué d’émotions.

Comme dans le cas de la voix, le langage est également porteur d’émotion. Il peut s’agir d’un langage oral (par exemple une conversation Skype ou un Google Hangout), d’un langage écrit (par exemple un commentaire Facebook ou un message sms), ou encore d’un langage pictural (des photos échangées sur Snapchat ou l’usage d’émoticons en sont de bons exemples). Tous ces supports du langage sont porteurs d’émotions, puisqu’ils sont issus de l’humain, et il est relativement facile (pour un autre humain) de reconnaître dans ces supports les différentes émotions décrites par Robert Plutchik.

Une conclusion partielle nous invite ici à reconnaître qu’il est relativement aisé de produire des données sur de l’immatériel.

Une illustration de ce phénomène peut être trouvé dans le travail du chercheur Lev Manovic et de son équipe qui, à travers l’analyse de centaines de selfies pris dans plusieurs villes du monde, dresse un état des lieux (certes culturellement biaisé, mais pas inintéressant néanmoins) de la bourse des valeurs des émotions dans plusieurs endroits du globe. L’équipe de recherche des Software Studies Initiative, aidée par le Turc mécanique d’Amazon, utilise les expressions faciales des individus captés dans des selfies pour évaluer leur statut émotionnel.

Cela permet d’observer qu’on est plus « heureux » à Rio qu’à Moscou par exemple. Mais au-delà de la simple observation, c’est la nature de cette information qui change. Evaluer le bonheur des individus selon leur région ne pouvait auparavant qu’être spéculation (« les gens sont plus heureux dans les pays chauds qu’au Nord ») ou évaluer à l’aide d’indicateurs imparfaits. Il était alors possible d’évaluer le pouvoir d’achat ou l’accès à des structures éducatives. En revanche, en analysant l’expression faciale des individus, il est possible d’en savoir plus sur cette notion qui échappent pourtant habituellement aux sciences sociales, le bonheur. Les marqueurs d’émotion dans les tweets envoyés partout autour du globe sont une autre possibilité de produire de la data sur de l’immatériel.

La data émotion, qui est un horizon -sans être la totalité- de l’anthropo-data, est donc une bonne illustration de la possibilité de quantifier l’humain, c’est-à-dire de le data-iser. Ce néologisme étant la seule ressource du langage qui nous est disponible pour penser la représentation de l’Homme en pièces d’informations numériques.

Une fois ces données collectées et stockées, se pose la question de leur traitement. Pour les raisons invoquées plus haut, il est facile pour un individu d’analyser les émotions d’un autre individu si tant est qu’ils partagent un minimum de références culturelles. Il est en revanche bien plus périlleux pour un algorithme de parvenir à des conclusions sur l’état émotionel d’une personne. Ou en tout cas, c’est ce qu’intuitivement une pensée pré-numérique imagine. En effet, comment Google peut-il savoir si, quand je tape « iPhone 5S » dans son moteur de recherche, j’épprouve pour cet objet de l’intérêt, de l’aversion, de l’admiration, ou de la crainte (pensez par exemple à tous les individus qui ressentent une phobie à adopter une nouvelle technologie)?

On touche là, le coeur du changement de paradigme opéré par le numérique. Google, de même que tous les autres services Web et par exemple Facebook, Twitter, Okcupid analysent toutes les traces des individus, tous les marqueurs de l’humain, toutes les empreintes laissées par la semelle du curseur de la souris dans la terre meuble des pages HTML.

Quelles sont-elles?

Encore une fois, elles se trouvent dans les interactions entre l’homme et la machine, ce qui revient plus précisément à dire dans le cas d’un site Internet l’endroit où vous posez les yeux sur l’écran, et où vous positionnez le curseur de votre souris et éventuellement les champs que vous renseignez au clavier, ces trois paramètres permettant de définir ce qu’il convient d’appeler une navigation Web. Et c’est cette navigation Web qui permet de dire si vous êtes plutôt serein, contrarié ou songeur. En effet, si vous êtes serein, vous aurez tendance à passer plus de temps sur les éléments qui viennent à vous, à mettre plus d’efforts en oeuvre pour trouver l’information que vous cherchez, à lire l’intérgralité d’un tweet avant de choisir de le retweeter. Il va de soi que chacune de ces micro-décisions ne sauraient à elle seule rendre compte de votre état émotionnel. En revanche, si l’on compile un grand nombre de ces informations et si on les relie entre elles, il devient beaucoup plus simple d’obtenir ce type de conclusion. Combien de temps est-il nécessaire à des sites où la dimension sociale est particulièrement forte pour obtenir ces résultats? Nous ne le savons pas, puisque cette information est détenue dans les algorithmes de ces sociétés qui n’ont aucun désir -ni injonction- à les publier.

Il est cependant facilement imaginable que les 21 minutes et 53 secondes passées en moyenne par les Français sur Facebook par jour en 2012 suffisent amplement à obtenir ce résultat.

Ainsi donc une définition ontologique de la data pourrait revenir à ses deux modes d’existence qui cohabitent: une information qui porte à la fois sur du matériel et de l’immatériel, et fait rentrer ces deux champs dans le domaine du quantifiable, mesurable, analysable.

Nous avons donc répondu à notre première question: l’immatériel et le psychologique peuvent-ils donner des datas, et nous y avons répondu par l’affirmative en convoquant l’exemple des émotions.

Cependant, les émotions ne sont pas la matière première du travail philosophique. Ce sont les idées, incarnées dans des concepts rendus tangibles par des mots qui constituent la matière du philosophe. Et le travail du philosophe consiste précisément à manier ces mots, à les remplir ou les vider de leur sens, à interroger leurs définitions, pour ne jamais s’en satisfaire. Il consiste à faire s’entrechoquer des concepts, à ré-actualiser des idées anciennes et à les utiliser pour éclairer une réalité contemporaine.


Ces idées, l’ensemble de ces idées, sont la production de l’Humanité et ont été incarnés dans la culture. Comme on l’a vu, celle-ci peut être approchée par de nombreuses façons, et le numérique pousse encore plus loin notre potentiel de compréhension de celle-ci. En définitive, le projet du numérique se situe ici, dans les potentialités qu’il offre à l’Homme de se connaître. Les idées, elles, sont irréductibles à la data-isation du monde. C’est la nouvelle frontière de la technologie. Il existe encore un objet qui échappe à la connaissance de l’Homme.

Ainsi la Philosophie est relativement hermétique à la question des datas. C’est l’une des seules (peut-être la seule) à ne pas être directement impactée par cette technologie dans son essence. Il lui reste cependant à penser l’impact du numérique sur les idées et leur génération, ce qui devrait pouvoir l’occuper un certain temps, et ce, sans le recours aux datas.