L’Intelligence Artificielle Racontée à mes Neveux et Nièces (8)

Marc Caillet
22 min readDec 5, 2021

--

Apprendre à jouer à une intelligence artificielle, c’est pas un truc de gamin ?

(Hilary, 18 ans, avec Astou et Mehdi, 18 ans, et Driss, 15 ans)

Où l’on se demande à quoi cela peut bien servir d’apprendre à jouer à une intelligence artificielle et où l’on découvre que, derrière cette façade ludique, se cachent des objectifs bien différents.

Marc
8-)

Si tu pensais me vexer, tu cours tout droit à la déconvenue !

Hilary
(^_^;)

Mehdi
(¬_¬)

En plus, il y a beaucoup de chercheurs de très haut niveau qui travaillent sur ces sujets ! C’est vrai qu’on pourrait se demander s’ils ne devraient pas mieux consacrer leurs efforts à des sujets plus importants…

Driss
(¬_¬)

Ouais, comme la médecine ou le climat, par exemple !

Astou
(¬_¬)

Et puis, ça doit coûter tellement cher…

Marc
8-)

Les jeux ont constitué très tôt, dans l’histoire de la discipline, un terrain fertile pour l’expérimentation et la mise au point d’intelligences artificielles. Rappelez-vous Arthur Samuel et ses travaux précurseurs sur les approches Machine Learning à travers le jeu de dames !

Hilary
=)

Ah oui, exact ! Même que ça date pas mal !

Mehdi
=)

Des années 1960, par là, si je me souviens bien !

Marc
8-)

De la fin des années 1950, plus exactement. Son article, Some Studies in Machine Learning using the Game of Checkers, a été publié en 1959.

L’histoire des machines qui jouent remonte à plus loin dans le passé, cependant.

Hilary, Astou, Mehdi & Driss
(O_o)

Marc
8-)

D’éminents chercheurs se sont très tôt demandé si un ordinateur était capable de dépasser les humains, en termes d’intelligence. La mesure de l’intelligence étant une tâche complexe et sujette à controverse, ils se sont dit que les jeux de stratégie constituaient une bonne façon, indirecte, de comparer l’intelligence humaine et celle de la machine.

Claude Shannon est l’un des fondateurs d’une théorie de l’information qui trouve des applications en cryptographie, par exemple. Dès 1949…

Hilary
(@_@)

1949 ! Encore ?

Marc
8-)

Oui, ça remonte bien à juste après la fin de la Seconde Guerre mondiale ! Et c’est effectivement cette année-là que s’est aussi tenu le séminaire Mind and Computing Machine, lequel a notamment alimenté la réflexion d’Alan Turing.

Mehdi
(¬_*)

Oui, voilà ! Et l’année suivante, il a publié son fameux article où il décrit le test qui permet de savoir si une machine est intelligente, le Test de Turing !

Marc
8-)

Quelle mémoire, Mehdi !

Dès 1949, donc, Claude Shannon justifie ainsi l’intérêt de créer une machine capable de jouer aux échecs : “Une machine qui joue aux échecs est un bon point de départ car : (1) le problème est très précisément défini, tant du point de vue des actions permises (les coups) que de l’objectif final (échec et mat) ; (2) il n’est ni trop simple au point d’être considéré comme trivial, ni trop complexe au point qu’on ne puisse pas parvenir à une solution satisfaisante ; (3) pour jouer de façon habile aux échecs, on considère généralement qu’il faut réfléchir ; une solution à ce problème nous forcera à admettre la possibilité d’une pensée mécanisée ou à restreindre davantage notre concept de ‘penser’ ; …

Driss
(@_@)

Euh… Je n’ai pas bien compris ce que ça implique…

Astou
8-)

Eh bien, si la machine arrive à jouer correctement aux échecs, ça voudra dire qu’elle aura été capable de réfléchir puisqu’on considère qu’il faut réfléchir pour jouer aux échecs.

Mehdi
8-)

Ou alors, si on n’est pas d’accord pour considérer que la machine aura réfléchi, on sera obligés de revoir ce qu’on entend par ‘réfléchir’.

Marc
8-)

C’est bien ça.

Claude Shannon poursuit : “… (4) la structure discrète du jeu d’échecs se prête bien à la nature digitale des ordinateurs modernes…

Driss
(^_^;)

Discrète, ça veut dire qu’elle ne fait pas beaucoup de bruit ?

Hilary, Mehdi & Astou
=D

Marc
8-)

Non.

Ça veut dire que chaque pièce se trouve exactement sur une case ou sur une autre ; aucune ne peut se trouver entre deux cases. Le nombre de positions possibles est fini et connu : 64 !

Et Claude Shannon termine ainsi : “Il est clair que le problème ne consiste ni à concevoir une machine qui joue parfaitement aux échecs (ce qui est irréalisable), ni à concevoir une machine qui jouerait simplement selon les règles du jeu (ce qui est trivial). Nous aimerions qu’elle joue habilement, peut-être de façon comparable à un être humain de bon niveau.

Astou
(¬_¬)

On voit bien que l’objectif réel se situait bien au-delà du jeu d’échecs. Shannon cherchait soit à démontrer qu’une machine peut réfléchir, soit à nous pousser à préciser notre définition de la notion de pensée.

Marc
8-)

Exact, Astou !

Dès les débuts, la conception d’intelligences artificielles qui jouent avait d’autres objectifs que le jeu en lui-même.

Hilary
(¬_¬)

Il l’a construite, la machine qui joue au jeu d’échecs, Shannon ?

Marc
8-)

Non.

Il a publié, l’année suivante, en 1950, un article intitulé Programming a Computer for Playing Chess, dans lequel il décrit en détail son algorithme.

La même année, Alan Turing finit de mettre au point son propre algorithme, nommé Turochamp. Il tente de le programmer sur un ordinateur, mais sa tentative se solde par un échec.

Driss
(¬_¬)

On ne peut pas savoir s’il fonctionnait alors…

Marc
8-)

Si, on le sait. Car Turing a persisté.

Ne se laissant pas décourager par son échec, il défie, en 1952, l’un de ses amis avec la contrainte suivante : lui, Alan Turing, doit jouer selon son algorithme, Turochamp.

Hilary
(o_O)

Ça a dû prendre super longtemps !

Marc
8-)

Environ une demi-heure pour chaque coup joué par Alan Turing ! La partie s’est terminée par une défaite de l’algorithme de Turing en 29 coups.

Driss
(¬_^)

Et quand est-ce qu’une machine à réussi à battre un champion du monde ? C’était Garry Kasparov ?

Marc
8-)

Il faut, en effet, attendre les années 1990, pour cela. Au début de cette décennie, les chercheurs d’IBM ont, à leur tour, travaillé à la mise au point d’une intelligence artificielle qui joue aux échecs. Nommée Deep Blue, elle vient à bout du champion du monde Garry Kasparov en 1997.

Hilary, Astou, Mehdi & Driss
(*_*)

Marc
8-)

Cette défaite de Garry Kasparov marque le début de la défaite de grands champions face à une intelligence artificielle.

En 2011, Watson, elle aussi créée dans les laboratoires d’IBM, a vaincu, au jeu télévisé Jeopardy, les champions Ken Jennings et Brad Rutter.

Astou
(¬_*)

Ah oui, je m’en souviens !

Marc
8-)

Plus récemment, la société DeepMind a conçu plusieurs intelligences artificielles qui jouent. Elles ont, elles aussi, connu un fort retentissement médiatique. Vous vous en souvenez aussi, j’imagine ?

Driss
=]

Évidemment !

Hilary
=)

Impossible d’oublier la victoire d’AlphaGo contre le grand maître coréen au jeu de Go ! Et puis contre le grand maître chinois pas longtemps après.

Mehdi
=)

Lee Sedol et Ke Jie ! Le deuxième a été battu par une version améliorée d’AlphaGo. Elle s’appelle AlphaGo Master.

Astou
=)

Ensuite, il y a eu AlphaGo Zero qui a appris à jouer au jeu de Go avec seulement les règles du jeu ! Puis AlphaZero qui, en plus du jeu de Go, a appris à jouer aux échecs et au shôgi. Là aussi en n’utilisant que les règles du jeu.

Driss
(¬_¬)

C’est quoi le shôgi, déjà ?

Mehdi
8-)

C’est le jeu d’échecs japonais !

Driss
(¬_*)

Ah oui, Shikamaru, il dit qu’il y joue dans Naruto !

Hilary
=)

Et c’est l’un des principaux sujets du manga March Comes in Like a Lion, de Chika Umino. Tu devrais le lire, il est super !

Astou
=)

Après, il y a eu MuZero aussi ! Cette intelligence artificielle, elle n’a même pas besoin des règles pour apprendre. Juste de visualiser et d’analyser son environnement immédiat, au fur et à mesure de sa progression dans le jeu !

Marc
8-)

C’est très bien résumé !

Eh bien, Demis Hassabis, l’un des cofondateurs de DeepMind, la société qui a créé AlphaGo et toutes ses descendantes, justifie ainsi les efforts importants consacrés à concevoir des intelligences artificielles capables de battre les meilleurs joueurs humains à différents types de jeux : “Les jeux sont conçus de façon à représenter un défi pour les humains et, généralement, représente un aspect intéressant du monde réel.” Et aussi : “Les environnements virtuels et les jeux constituent une plateforme idéale pour développer et tester des algorithmes d’intelligence artificielle. Les jeux sont très pratiques car beaucoup d’entre eux ont des scores, il est donc très facile de mesurer les progrès incrémentiels.

Et donc, remporter des victoires aux jeux, si complexes soient-ils, n’est pas une fin en soi. C’est essentiellement un moyen pratique pour l’élaboration d’intelligences artificielles capables de traiter des problèmes autrement plus conséquents pour les humains.

Driss
(¬_*)

Donc, travailler à la mise au point d’une intelligence artificielle qui joue, c’est un moyen détourné pour trouver des méthodes pour résoudre des problèmes importants, en fait !

Marc
8-)

C’est exactement ça !

Astou
(¬_*)

Parce qu’avec les jeux, c’est plus facile de mesurer les progrès, grâce au score. Plus le score obtenu est élevé, plus l’intelligence artificielle a fait de progrès !

Mehdi
(¬_*)

Et quand une intelligence artificielle arrive à battre les meilleurs joueurs humains à un jeu, ça veut dire qu’elle peut trouver des meilleures stratégies que nous pour résoudre des vrais problèmes, alors ?

Marc
8-)

Vous avez bien compris le principe !

Hilary
(¬_¬)

Watson, par exemple, elle a servi à quoi, concrètement ?

Marc
8-)

Après sa victoire au jeu Jeopardy, IBM a développé Watson dans de nombreux domaines, tels que la banque ou le marketing. Mais, ce sont les applications pour les soins de santé et l’aide à la décision qui ont été les plus médiatisées.

C’est dans le secteur de la santé qu’IBM a fait les plus gros efforts financiers. En 2015, en effet, la société américaine a investi plusieurs milliards de dollars dans sa division Watson Health. Avec pour objectif principal la création et la commercialisation d’intelligences artificielles qui aideraient les médecins à diagnostiquer et à traiter différents types de cancer !

Astou
(¬_¬)

Ils y sont arrivés ?

Marc
8-)

Malheureusement, Watson Health n’a pas réussi à convaincre les médecins avec ses technologies.

La division santé d’IBM a été l’objet de nombreuses critiques. Elle a été pointée du doigt pour avoir réalisé bien peu de choses après avoir promis beaucoup, engendrant une immense déception et entachant sérieusement sa réputation.

Hilary, Astou, Mehdi & Driss
(°_°)

Marc
8-)

Par ailleurs, et toujours dans la suite directe du succès de Watson au jeu Jeopardy, IBM s’est engagée dans la mise au point d’une intelligence artificielle capable de débattre en direct avec des humains. Nommée Project Debater, elle a pour objectif de parvenir à être aussi crédible qu’un débatteur humain.

Driss
(¬_¬)

Une sorte de nouveau jeu…

Marc
8-)

En quelque sorte, oui. Qui requiert, cependant, des compétences bien différentes de celles qui sont nécessaires pour les jeux de type jeu de Go ou jeu d’échecs.

Hilary
(¬_¬)

Lesquelles ?

Marc
8-)

En particulier, la capacité à modéliser la controverse et le dilemme.

Astou
(¬_¬)

Mais, comment pourrait-elle réussir à construire une argumentation ?

Marc
8-)

Une solution pourrait être de faire appel à l’apprentissage par renforcement.

Driss
(¬_¬)

De quelle manière ?

Marc
8-)

L’apprentissage par renforcement permet à une intelligence artificielle de définir un plan d’action optimal pour réaliser au mieux son objectif.

Astou
(¬_*)

Ah ! Et donc une bonne argumentation serait une sorte de plan d’action optimal pour réussir l’objectif de convaincre ?

Marc
8-)

Précisément !

Mehdi
(^_^)

Ça serait tellement utile comme assistant qui nous aiderait à prendre des décisions difficiles ! Celles où il faut peser le pour et le contre… Surtout dans les cas où il faut prendre en compte un grand volume d’information.

Marc
8-)

Et ça va tout à fait dans le sens des propos d’Andy Clark, le professeur de logique et de métaphysique de l’Université d’Edinburgh dont je vous ai parlé une fois déjà : en nous permettant de mieux comprendre les conséquences de nos choix et d’avoir une meilleure connaissance des possibilités qui s’offrent à nous, l’intelligence artificielle pourrait nous aider à prendre des décisions plus éclairées et plus morales.

Driss
(¬_¬)

Et AlphaGo et toutes les versions qui ont suivi, c’est quoi les applications ?

Marc
8-)

Juste après la victoire d’AlphaGo face à Lee Sedol, Demis Hassabis déclare, dans un article intitulé What We Learned in Seoul with AlphaGo : “L’objectif de notre test public d’AlphaGo dépassait de loin le simple fait de gagner au jeu de Go. Nous avons fondé DeepMind en 2010 afin de créer une intelligence artificielle généraliste, capable d’apprendre par elle-même qui, un jour, pourra être utilisée comme un outil pour aider la société à résoudre certains de ses problèmes les plus importants et les plus urgents, tels que le changement climatique ou le diagnostic médical.

Mehdi
(o_O)

Une intelligence artificielle généraliste ? Comme dans les œuvres de science-fiction ?

Marc
8-)

Comme une sorte de Jarvis, super assistant d’Iron Man, dans la série de films éponymes et The Avengers, j’imagine.

Mehdi
(o_O)

Mais tu as dit l’autre jour qu’on était encore loin de pouvoir en concevoir…

Marc
8-)

C’est juste.

Demis Hassabis le dit lui-même dans la suite de l’article dans lequel il tire les leçons de la victoire d’AlphaGo : “Bien qu’il soit significatif, ce n’est qu’un petit pas en direction de la conception de machines intelligentes. […]. Les réseaux de neurones profonds sont déjà utilisés par Google pour la réalisation de tâches spécifiques, telles que l’amélioration de la recherche d’images, de la reconnaissance de la parole, de l’ordonnancement des résultats du moteur de recherche. Cependant, nous sommes encore très loin d’une machine suffisamment flexible pour apprendre à réaliser toutes les tâches intellectuelles qu’un humain est capable d’effectuer — la marque d’une véritable intelligence artificielle généraliste.

Astou
(¬_¬)

Quand Demis Hassabis dit qu’on est loin de pouvoir concevoir une intelligence artificielle généraliste, dans combien de temps serons-nous capables de le faire, selon toi ?

Marc
¯\_(ツ)_/¯

Difficile à dire… Plusieurs décennies ?

Driss
(@_@)

Ça serait dans pas si longtemps, en fait !

Marc
8-)

Ce n’est qu’une très vague prédiction, ne la prends surtout pas à la lettre ! Dans le fond, je n’en sais strictement rien.

Hilary
(¬_¬)

Elle a quoi de spécial, AlphaGo, qui pourrait servir pour traiter d’autres problèmes ?

Marc
8-)

Comme le montre bien l’affrontement face à Lee Sedol, AlphaGo a la capacité de considérer le plateau de jeu de façon globale et de trouver des solutions qu’un humain n’aurait pas considérées ou encore là où un humain a appris à ne surtout pas s’engager. Demis Hassabis souligne qu’une technologie de ce type peut permettre de trouver des solutions que les humains n’entrevoient même pas.

Par exemple, peu de temps après la victoire d’AlphaGo, DeepMind a mis au point une intelligence artificielle pour l’optimisation des systèmes de refroidissement des centres de serveurs de Google, systèmes de refroidissement qui représentent une part très importante de la dépense énergétique de ces centres. Résultat : une réduction substantielle de la consommation énergétique !

Mehdi
=
)

Ça, c’est bien joué !

Marc
8-)

Ensuite, grâce à AlphaZero, des progrès ont pu être réalisés en chimie et en physique quantique. Quant à MuZero, DeepMind entrevoit des applications dans les domaines de la robotique et des systèmes industriels.

Hilary, Astou, Mehdi & Driss
(¬_¬)

Marc
8-)

AlphaStar est une autre intelligence artificielle créée par DeepMind.

Driss
(¬_*)

AlphaStar ? Elle joue, elle aussi ?

Marc
8-)

Elle joue, elle aussi, oui.

À Starcraft II, un jeu vidéo auquel elle a atteint le rang de Grand Maître. Ce jeu présente de nombreux défis, bien différents, pour la plupart, de ceux qu’il a fallu relever pour mettre au point AlphaZero et MuZero : il n’existe pas de meilleure stratégie pour remporter une partie ; l’information sur la situation du jeu, à un moment donné de la partie, est incomplète ; une action prise ne produit pas nécessairement un effet immédiat, il peut être tardif ; il se joue en temps réel ; et, enfin, il nécessite de contrôler plusieurs unités à la fois.

Astou
(^_^)

Et donc, les techniques mises en œuvre pour la conception d’AlphaStar peuvent être appliquées à des problématiques de la vie réelle qui présentent des défis similaires !

Marc
8-)

Tout à fait !

On peut voir que les équipes de DeepMind explorent un grand nombre de situations réelles à travers le jeu.

L’objectif annoncé par la compagnie dirigée par Demis Hassabis est très clairement de créer des intelligences artificielles grâce auxquelles pourront être faites des découvertes scientifiques capitales et bénéfiques pour l’humanité.

Mehdi
(¬_¬)

Ils ont réussi à en faire, des découvertes scientifiques majeures, grâce à une intelligence artificielle ?

Marc
8-)

Oui, une jusqu’à présent !

Dès 2018, DeepMind a révélé au monde AlphaFold, une intelligence artificielle spécialisée dans la prédiction de la structure tridimensionnelle des protéines après repliement, dont les performances sont nettement supérieures à celles obtenues jusqu’alors par ses concurrentes.

Deux ans plus tard, AlphaFold 2 lui a succédé. Elle la surpasse très largement.

Driss
(¬_¬)

Heu… c’est quoi, des protéines ?

Hilary
8-)

Les protéines sont des molécules complexes qui déterminent tous les aspects du fonctionnement de notre corps : système respiratoire, système musculaire, système digestif, système immunitaire…

Mehdi
8-)

Et la fonction d’une protéine est déterminée par sa structure tridimensionnelle.

Marc
8-)

Lors de son discours de réception du Prix Nobel de chimie, en 1972, Christian Anfinsen a postulé que la structure d’une protéine est déterminée par sa séquence d’acides aminés.

Ce postulat a représenté un problème insoluble pendant près de cinquante ans. AlphaFold 2 est maintenant considéré comme la solution à ce problème.

Driss
(¬_¬)

Et à quoi ça sert de prédire leur structure tridimensionnelle ?

Marc
8-)

Ça peut servir à mieux comprendre comment se développent certaines maladies. À partir de cette meilleure compréhension, il devrait alors être possible de créer des médicaments plus efficaces.

Le COVID Moonshot est un consortium mondial à but non lucratif de scientifiques qui se consacrent à la recherche d’un traitement contre le COVID-19 qui soit facile à produire et peu onéreux. La prise en compte de la structure tridimensionnelle des protéines a permis aux chercheurs qui travaillent dans le cadre de ce consortium d’accélérer la mise au point de traitements, comme le rapporte David Cox, dans un article pour Wired publié en 2021.

Certes, la structure tridimensionnelle de ces protéines a été estimée par des méthodes traditionnelles. Mais cela montre bien l’intérêt de cette structure pour la mise au point de médicaments.

Astou
(¬_¬)

Mais, DeepMind, c’est une entreprise, non ?

Marc
8-)

Oui, c’est une entreprise, tu as raison. Elle a été acquise par Google en 2014, puis elle est passée sous la coupe d’Alphabet, la maison-mère de Google, l’année suivante.

Astou
(¬_¬)

Alors cette découverte scientifique va rester la propriété d’Alphabet. Comment pourrait-elle aider l’humanité dans sa globalité ?

Marc
8-)

Au cours de l’été 2021, DeepMind a rendu accessible à tous le code informatique d’AlphaFold 2, ainsi que toutes les prédictions de structures tridimensionnelles réalisées par l’intelligence artificielle.

Par ailleurs, DeepMind a récemment annoncé avoir établi un partenariat avec l’organisation pharmaceutique à but non lucratif DNDi, Drugs for Neglected Disease initiative.

Hilary
=)

Comme ça, on pourra vite savoir si AlphaFold 2 peut servir à traiter des problèmes du monde réel !

Mehdi
=)

Et tout le monde pourra l’utiliser gratuitement ! Même les scientifiques de pays pauvres qui n’ont pas d’argent pour des machines coûteuses !

Astou
=)

Et aussi pour traiter des maladies négligées par l’industrie pharmaceutique parce que la mise au point d’un traitement pour les traiter ne serait pas rentable !

Marc
8-)

De plus, sur la base du succès rencontré par AlphaFold 2, Demis Hassabis a créé une nouvelle société, Isomorphic Labs, sous la coupe d’Alphabet, également. Son objectif : parvenir, grâce à l’intelligence artificielle, à accélérer la découverte de nouveaux médicaments et à trouver des remèdes aux maladies qui nous résistent encore. Dans son annonce de la création de cette nouvelle société, Demis Hassabis cite AlphaGo pour rappeler que les intelligences artificielles formées pour jouer ont servi de terrain d’expérimentation pour la conception de systèmes d’apprentissage à usage plus général. Il estime qu’elles sont arrivées à un niveau de maturité suffisant pour s’attaquer à des problématiques beaucoup plus conséquentes pour l’humanité.

Hilary, Astou & Mehdi
(*_*)

Driss
(¬_¬)

Et il n’y a que DeepMind et IBM qui ont font des recherches en intelligence artificielle en jouant à des jeux pour en mettre au point qui pourront aider les humains ?

Marc
8-)

Absolument pas !

Les équipes de recherche en intelligence artificielle d’autres très grosses entreprises suivent également cette voie.

Microsoft mène, à travers le jeu, deux projets qui visent à développer la collaboration entre intelligences artificielles et humains.

Le premier, Malmo, a été développé au sein du métavers Minecraft.

Hilary
(¬_^)

Ah ? Pourquoi dans Minecraft ?

Marc
8-)

Parce que c’est un environnement aux possibilités immenses. Minecraft est un monde ouvert dans lequel tu peux simplement te promener, tout comme tu peux tout aussi bien y construire des structures complexes en collaboration avec d’autres individus présents dans le métavers.

C’est un terrain d’expérimentation fertile pour la recherche en intelligence artificielle, notamment dans le domaine de la collaboration.

Hilary
(¬_*)

Donc, ce projet permet d’expérimenter différentes formes de collaborations entre humains et intelligences artificielles pour réaliser des tâches plus ou moins complexes…

Marc
8-)

Oui, voilà.

Pour y parvenir, les intelligences artificielles doivent développer une représentation du métavers et la capacité d’apprendre à y agir de façon cohérente. Cet apprentissage, elles doivent pouvoir le faire tant par elles-mêmes qu’à l’aide des humains ou d’autres intelligences artificielles dont elles croiseront le chemin.

Et pour que leur collaboration soit fructueuse, intelligences artificielles et humains doivent nécessairement développer une bonne communication.

Mehdi
(¬_^)

C’est un gros défi ! Et tout le monde peut faire des expérimentations avec Malmo ?

Marc
8-)

Tout le monde, oui.

Mehdi
(¬_^)

Même moi ?

Astou
(¬_^)

Et moi aussi ?

Marc
8-)

Même toi, oui, Mehdi. Toi aussi, Astou. Et Driss. Et Hilary. Tout le monde !

Le projet est libre d’accès à tous. Il est d’un abord simple. C’est un bon moyen de se faire une idée plus concrète de ce qu’est l’apprentissage par renforcement.

Mehdi
(*_*)

Ça donne envie d’essayer !

Driss
(¬_¬)

Et le deuxième projet, il permet de faire quoi ?

Marc
8-)

Le deuxième projet s’appelle Paidia. Il se concentre, lui aussi, sur l’apprentissage de la collaboration entre joueurs humains et intelligences artificielles.

Driss
(¬_^)

Quelle différence, alors, avec le project Malmo ?

Marc
8-)

Paidia se concentre spécifiquement sur les jeux vidéo. Il vise à l’amélioration de l’expérience de jeu à travers le développement d’intelligences artificielles capables de s’adapter au comportement des joueurs humains et de collaborer avec eux dans l’accomplissement de leurs missions.

Il a été développé, originellement, en collaboration avec le studio de développement de jeux vidéo Ninja Theory, au sein du jeu Bleeding Age.

Driss
¯\_(ツ)_/¯

Connais pas…

Marc
8-)

C’est un jeu de combat multi-joueurs, chaque combattant ayant ses propres spécificités. Vaincre nécessite une collaboration efficace entre tous les membres d’une même équipe. Il n’a malheureusement pas connu le moindre succès, si bien que Ninja Theory a mis un terme à son développement au début de l’année 2021.

Cependant, le projet Paidia est toujours bien actif, lui, et donne toujours lieu à l’expérimentation de multiples modes de collaboration entre humains et intelligences artificielles.

Astou
(¬_¬)

J’imagine que les résultats de ces travaux pourraient être utilisés en dehors du monde du jeu vidéo…

Marc
8-)

J’imagine aussi, oui.

Mehdi
(¬_*)

En plus de la collaboration entre humains et intelligences artificielles, à un moment, tu as parlé de collaboration entre intelligences artificielles et ça m’a fait penser à celles qui jouent à cache-cache, Driss en a parlé, l’autre jour.

Driss
(¬_*)

Ah oui ! Je ne sais plus qui les a conçues, par contre…

Marc
8-)

Il s’agit d’OpenAI, fondée notamment par Elon Musk qui l’a quittée depuis. Elle fait, elle aussi, beaucoup parler d’elle sur le terrain de l’expérimentation à travers le jeu, en particulier dans le domaine des jeux qui nécessitent la collaboration entre plusieurs agents.

Elle a notamment développé, en effet, un ensemble d’intelligences artificielles capables de jouer à cache-cache.

Hilary
(¬_¬)

Je ne me souviens plus trop du principe, ni des résultats…

Astou
(¬_¬)

Moi non plus…

Marc
8-)

Deux équipes de deux joueurs, chacun d’entre eux dirigé par une intelligence artificielle : les membres d’une équipe se cachent ; les membres de l’autre partent à leur recherche. La spécificité de cette expérimentation : des objets ont été disposés sur le terrain de jeu.

Au fur et à mesure que les intelligences artificielles se perfectionnaient dans le jeu, les joueurs d’une équipe comme de l’autre se sont mis à exploiter intelligemment ces objets, de façon collaborative, parfois de manière tout à fait inattendue.

Driss
(¬_¬)

En fait, c’est comme si un groupe d’intelligences artificielles pouvaient collaborer pour atteindre un objectif commun. Et en utilisant des objets qu’elles trouvent dans leur environnement de façon astucieuse, en plus !

Marc
8-)

C’est tout à fait ce que montre cette expérimentation ludique !

Hilary
(¬_¬)

Quelles sortes d’objets étaient disposés dans l’environnement du jeu ? Et quelles stratégies, elles ont trouvées, les intelligences artificielles ?

Marc
8-)

L’environnement de cette expérimentation est très simple : on y trouve, des murs, des blocs rectangulaires, des cubes et des rampes.

Les stratégies créatives ne sont pas apparues immédiatement. Ce n’est qu’au bout d’un grand nombre de parties que les intelligences artificielles qui se cachaient ont eu un comportement nouveau : elles se sont mises à utiliser les blocs rectangulaires pour construire des sortes de forts et s’y réfugier, empêchant ainsi les intelligences artificielles qui étaient à leur recherche de les trouver. En réponse à cette stratégie, celles qui cherchaient ont appris à déplacer les rampes et à les utiliser pour sauter à l’intérieur des forts.

Hilary, Astou, Mehdi & Driss
(O_o)

Marc
8-)

Alors, les premières, celles qui se cachaient, ont appris, à leur tour, à déplacer les rampes, puis à les cacher à l’intérieur des forts avant que leurs adversaires ne puissent s’en emparer.

Astou
(¬_¬)

Elles ont trouvé une nouvelle stratégie, les intelligences artificielles qui cherchaient ?

Marc
8-)

Oui. Une stratégie qui a étonné les concepteurs de l’expérience eux-mêmes car ils ne se doutaient qu‘une telle action était réalisable dans l’environnement qu’ils avaient conçu : elles ont appris à utiliser les cubes, en sautant dessus, pour se déplacer jusqu’aux parois du fort !

Hilary, Astou, Mehdi & Driss
(o_O)

Marc
8-)

Les intelligences artificielles qui se cachaient ont, enfin, trouvé une parade ultime qui a consisté à bloquer les cubes.

Mehdi
(¬_*)

C’est comme AlphaGo qui a trouvé des solutions auxquelles les joueurs humains n’avaient jamais pensé.

Marc
8-)

Exactement !

Driss
(*_*)

On peut bien imaginer, là encore, qu’on aura bientôt des intelligences artificielles qui seront capables de trouver de nouvelles solutions à des vrais problèmes !

Mehdi
(¬_¬)

Mais on a vu aussi, précédemment, que ça pouvait poser des problèmes. Si les intelligences artificielles apprennent des comportements inimaginables pour nous, elles pourraient potentiellement être dangereuses.

Marc
8-)

C’est juste.

Katja Hofmann, la chercheuse de Microsoft qui est à la tête du projet Malmo, voit dans les jeux le terrain idéal, car sans conséquence pour notre monde, pour expérimenter les conditions de création d’intelligences artificielles sûres et responsables : “Je trouve que ces comportements, dans un cadre de jeu, sont un excellent moyen d’explorer les possibilités et les limitations des approches existantes dans un environnement sûr,” a-t-elle déclaré, selon des propos rapportés par la journaliste Eliza Strickland pour la revue IEEE Spectrum. “De tels résultats nous aideront à acquérir une meilleure compréhension de la façon de valider et de débugger des systèmes basés sur l’apprentissage par renforcement — une étape cruciale vers des applications dans le monde réel.

Hilary, Mehdi & Driss
(¬_¬)

Astou
(¬_¬)

OpenAI a conçu d’autres intelligences artificielles qui jouent ?

Marc
8-)

Oui.

À Dota 2, par exemple. Un jeu en ligne d’affrontements dans une arène qui oppose deux équipes de cinq joueurs. Chacun des joueurs a le contrôle d’un personnage de son équipe, personnage disposant de capacités spécifiques. Le 13 Avril 2019, OpenAI Five, l’intelligence artificielle conçue par OpenAI pour jouer à Dota 2, a battu le champion du monde en titre. OpenAI Five n’est cependant pas spécifiquement dédiée à Dota 2. Elle a été employée avec succès pour le développement d’une main robotique dotée d’une belle dextérité.

Hilary
(¬_¬)

Elle a été utilisée pour faire quoi, cette main robotique ?

Marc
8-)

À ma connaissance, elle en est restée au stade de la preuve de faisabilité. Sa dextérité a été démontrée à travers la résolution du Rubik’s Cube à une seule main.

Mehdi
(¬_^)

Elle avait sûrement une caméra en plus, la main, pour résoudre le Rubik’s Cube. Et puis, elle avait dû apprendre à le résoudre.

Marc
8-)

Tout juste !

Facebook s’y est mis, également. Tout d’abord, avec la conception d’une intelligence artificielle capable de jouer à Hanabi, un jeu de cartes collaboratif à information partielle et imparfaite, avec des possibilités de communication limitées entre les joueurs. Le but du jeu est de réaliser le plus beau feu d’artifice possible.

Mehdi
(¬_*)

En quoi l’information est-elle incomplète et qu’est-ce que c’est qu’une information imparfaite ?

Marc
8-)

L’information est incomplète car chaque joueur voit les cartes de ses partenaires, mais pas les siennes. Elle est imparfaite car, à chaque tour de jeu, chaque joueur doit prendre une décision sans connaître le choix des autres.

Dans la lignée des résultats obtenus avec le projet Malmo, et des performances réalisées par AlphaStar et OpenAI Five, Facebook s’est attaqué à un autre jeu d’une grande difficulté, NetHack, qui a la particularité de ne laisser aucune place à l’erreur.

Astou
(¬_^)

C’est quoi, ce jeu ? Quel est l’objectif ?

Marc
8-)

C’est un ancien jeu qui a été publié pour la première fois en 1987. L’objectif ? Récupérer une amulette magique cachée dans un donjon. Pour y parvenir, les joueurs doivent surmonter les épreuves que leur réservent les 50 niveaux qu’ils doivent traverser. Ils disposent de baguettes magiques, d’armes, d’armures, de potions, de sorts et de bien d’autres atouts encore. Cependant, la moindre erreur est fatale : non seulement, le joueur recommence au tout début, mais en plus, il est confronté à un tout nouveau donjon. Il ne peut donc pas profiter de l’expérience acquise lors de sa précédente mésaventure.

Les concepteurs de l’intelligence artificielle capable de jouer à NetHack, Edward Grefenstette, Tim Rocktäschel, and Eric Hambro donnent les ingrédients de la victoire : “Il faut 25 à 50 fois plus de temps à un joueur expert pour terminer [NetHack] avec succès que pour gagner une partie de Starcraft II, et les interactions entre les joueurs et l’environnement sont extrêmement complexes, donc, pour réussir, il est nécessaire de faire appel à son imagination pour résoudre des problèmes de façon créative ou surprenante, et aussi consulter des sources d’information externes au jeu, telle que le Guide ou le Wiki de NetHack, des vidéos en ligne, des forums de discussion.

Hilary
(°_°)

C’est presqu’impossible de gagner à ce jeu !

Mehdi
(¬_*)

J’ai l’impression que, à travers le jeu, on entraîne des intelligences artificielles à résoudre des problèmes dans des conditions de plus en difficiles ! Et pour résoudre des problèmes du monde réel de plus en plus complexes !

Driss
(¬_*)

Et faire des expérimentations de toute sorte dans un environnement sans risque et dans lequel on peut mesurer facilement les progrès !

Astou
(¬_*)

Avec également l’objectif de concevoir des intelligences artificielles de moins en moins spécifiques.

Marc
8-)

En effet !

On a vu que dès l’époque de la machine à jouer au jeu d’échecs de Claude Shannon, l’objectif se situait bientôt du jeu lui-même. Si, à cette époque-là, les chercheurs avaient l’ambition de créer des intelligences artificielles qui pensent comme des humains…

Hilary
(¬_*)

Ah ben, maintenant, on utilise les jeux pour mettre au point des intelligences artificielles qui agissent rationnellement !

Marc
8-)

Dans le but de trouver des solutions novatrices à des problèmes qui nous résistent !

Ainsi, loin d’être un truc de gamin, apprendre à jouer à une intelligence artificielle est un excellent moyen d’expérimenter la conception d’intelligences artificielles qui collaboreront avec les humains pour la résolution de problèmes critiques, l’accompagnement vers de nouvelles découvertes et l’acquisition de nouvelles connaissances.

Hilary, Astou, Mehdi & Driss
(*_*)

Marc
8-)

Merci pour ta question, Hilary !

Hilary
=]

Driss
(¬_¬)

Il n’y a pas très longtemps, pendant une de nos conversations, on a dit qu’on ne pouvait pas connaître les règles qu’une intelligence artificielle a trouvées pour faire une tâche qu’on lui a demandé de réaliser. Et donc, il y a un truc que je voudrais bien savoir, pour la prochaine fois : comment on peut faire confiance à une intelligence artificielle dans ce cas ?

Marc
8-)

Bonne question !

Et formulée comme si c’était le titre d’un chapitre d’un livre ?

Driss
(¬_¬)

Ah oui ! Alors…

Comment peut-on faire confiance à une intelligence artificielle, alors qu’on ne sait pas ce qu’elle a appris ?

--

--