IA vs IAG : définitions et état des lieux

Image générée par Midjourney v6, Stéphanie Renverseau mars 2024

L’Intelligence Artificielle (ou IA) est devenue un sujet incontournable, suscitant autant d’enthousiasme que d’interrogations. Ses avancées fulgurantes promettent de transformer en profondeur notre société, notre façon de vivre et de travailler. Parmi les développements les plus marquants, l’Intelligence Artificielle Générale (ou IAG) se profile comme une perspective aussi fascinante qu’incertaine.

Dans cet article de fond, je vous propose un tour d’horizon complet de l’IA et de l’IAG, en clarifiant ces concepts et en dressant un état des lieux des dernières innovations dans ce domaine en constante effervescence. À l’aube d’une nouvelle ère technologique, il est essentiel de comprendre les enjeux de l’intelligence artificielle pour mieux en cerner les opportunités et les défis.

Concept général de l’IA

L’IA désigne la capacité des machines à reproduire des comportements intelligents, habituellement associés à l’intelligence humaine. Il s’agit de systèmes informatiques capables d’effectuer des tâches qui nécessitent normalement l’intervention de l’intelligence humaine, telles que la reconnaissance visuelle, la compréhension du langage, la prise de décision et l’apprentissage. L’IA repose sur des algorithmes complexes, alimentés par des données massives, qui permettent aux machines d’apprendre, de s’adapter et d’évoluer de manière autonome.

Le concept d’IA a été formalisé dans les années 1950 par le mathématicien Alan Turing, qui a proposé un test (le fameux “test de Turing”) pour évaluer la capacité d’une machine à exhiber un comportement intelligent. Depuis, l’IA a connu des périodes fastes et des “hivers”, avant de connaître un essor sans précédent ces dernières années, porté par les progrès de l’informatique et l’explosion des données disponibles.

Différents types d’IA (faible, forte, super-intelligence)

On distingue généralement trois grands types d’IA, en fonction de leur niveau de sophistication et d’autonomie :

  • L’IA faible (ou IA étroite) : il s’agit d’IA spécialisées dans une tâche spécifique, comme jouer aux échecs, reconnaître des images ou traduire des textes. Elles excellent dans leur domaine de prédilection, mais sont incapables de s’adapter à d’autres contextes. La plupart des IA actuelles entrent dans cette catégorie.
  • L’IA forte (ou IA générale) : ce type d’IA serait capable de réaliser n’importe quelle tâche intellectuelle, au même titre qu’un être humain. Elle ferait preuve de polyvalence, d’adaptabilité et de créativité. Si ce type d’IA relève encore largement de la science-fiction, certains chercheurs estiment que les progrès actuels nous rapprochent peu à peu de cet horizon.
  • La super-intelligence : ce stade ultime de l’IA désigne une intelligence qui surpasserait de loin les capacités humaines dans tous les domaines (scientifique, créatif, social, etc.). Une telle IA serait capable d’apprentissage et d’évolution autonomes, avec des conséquences potentiellement vertigineuses. Ce scénario, qui nourrit de nombreux débats philosophiques et éthiques, reste pour l’heure hautement spéculatif.

L’IAG et ses spécificités

L’IAG (rappelez vous : Intelligence Artificielle Générale et non générative), aussi connue sous le nom d’IA forte, se réfère à une intelligence artificielle qui serait capable d’effectuer n’importe quelle tâche intellectuelle qu’un être humain peut réaliser. Contrairement à l’IA faible, qui se concentre sur des applications spécifiques, l’IAG vise à créer des systèmes dotés de capacités cognitives générales, capables de comprendre, d’apprendre, de raisonner et de s’adapter à des situations nouvelles de manière autonome.

Les spécificités de l’IAG incluent :

  • La polyvalence : une IAG serait capable de réussir dans une grande variété de domaines, sans être limitée à une tâche prédéfinie.
  • L’adaptabilité : face à des situations inédites, une IAG serait capable d’ajuster son comportement et d’apprendre de ses expériences.
  • La créativité : au-delà de la simple exécution de tâches, une IAG serait en mesure de faire preuve d’originalité et d’inventivité.
  • La compréhension du contexte : une IAG serait capable de saisir les subtilités du langage, les émotions et les intentions, en s’appuyant sur une compréhension profonde du monde qui l’entoure.

À ce jour, l’IAG reste un objectif à long terme, qui soulève de nombreux défis techniques et théoriques. Les chercheurs s’interrogent notamment sur les mécanismes de la cognition humaine et sur les architectures informatiques qui permettraient de les répliquer artificiellement.

Quelles différences entre IA et IAG ?

Les principales différences entre l’IA (faible) et l’IAG peuvent être résumées ainsi :

  • Champ d’application : l’IA se concentre sur des tâches spécifiques (reconnaissance d’images, traduction automatique, etc.), tandis que l’IAG vise une intelligence polyvalente, applicable à n’importe quel domaine.
  • Adaptabilité : l’IA est généralement conçue pour exceller dans un contexte précis, alors que l’IAG serait capable de s’adapter à des situations nouvelles et d’apprendre de manière autonome.
  • Compréhension : l’IA s’appuie sur des modèles statistiques pour identifier des patterns, sans réelle compréhension du monde, contrairement à l’IAG qui viserait une compréhension profonde du contexte et des concepts.
  • Créativité : l’IA est capable d’optimisation et de génération de contenu basé sur des modèles existants, mais l’IAG serait en mesure de faire preuve de créativité et d’innovation.
  • Conscience : l’IA n’a pas de conscience d’elle-même ni de son environnement, tandis que l’IAG pourrait potentiellement développer une “forme de conscience” et d’intentionnalité.

Il est important de noter que ces différences relèvent largement de la spéculation, car l’IAG n’existe pas encore. Néanmoins, elles permettent de mieux cerner les enjeux et les défis associés à cette perspective.

Les dernières nouveautés dans ce domaine

Ces dernières années ont été marquées par des avancées spectaculaires dans le domaine de l’IA, en particulier dans le traitement du langage naturel et la génération de contenu. Parmi les réalisations les plus marquantes, on peut citer :

Les IA Textes :

  • Les IA conversationnelles : les assistants virtuels comme Siri (Apple), Alexa (Amazon) ou encore GPT-4 (OpenAI) ont atteint un niveau de sophistication inédit, capable de soutenir des conversations de plus en plus naturelles et contextualisées.
  • AlphaFold (2021): développé par DeepMind (Google), cet algorithme a permis une avancée majeure dans la prédiction de la structure 3D des protéines à partir de leur séquence d’acides aminés. Cette réalisation a des implications considérables pour la recherche biomédicale et la découverte de nouveaux médicaments.
  • Perplexity (juillet 2022) IA gratuite utilise le modèle GPT-3.5 (gratuit aussi) qui agit principalement comme un moteur de recherche. Lorsque vous lui soumettez une requête, il effectue des recherches en temps réel sur internet pour trouver des informations pertinentes et à jour sur une multitude de sujets. En réponse à votre demande, il vous propose des suggestions accompagnées de sources pour appuyer ses propos. Bien que ses capacités conversationnelles soient relativement limitées par rapport à d’autres agents conversationnels, IA gratuite se distingue par sa capacité à fournir des sources fiables, en particulier dans sa version payante, pour étayer les informations qu’il présente. Perplexity IA Pro : 20$ par mois.
Essai d’un prompt standard sur Perplexity IA
Test d’un prompt simple sur Perplexity Pro, Stéphanie Renverseau, mars 2024
  • LLaMa 2 (début 2023), le modèle de langage développé par Meta. Ce modèle a été conçu pour être plus compact, plus facile à utiliser et offrir des performances comparables aux modèles de langage GPT-3.5 et GPT-4 qui alimentent ChatGPT. Llama était considéré comme l’entrée de Meta dans la compétition de l’IA. Le 18 juillet, Meta a annoncé une nouvelle étape dans le développement de Llama, en partenariat avec Microsoft, avec le lancement de la version 2.0 du modèle de langue. Cette nouvelle version apporte des améliorations techniques et se distingue par sa disponibilité gratuite pour la recherche et les utilisations commerciales, tout en étant publiée en code source ouvert (open source). LLaMa 2 est téléchargable.
Test d’un prompt simple sur LLaMA, plateforme Aurora by Tomorrow Theory, Stéphanie Renverseau, mars 2024
  • GPT-4 Turbo (Generative Pre-trained Transformer 4 — mars 2023) prononcer Djipiti 4 : développé par OpenAI, ce modèle de langage représente une avancée significative par rapport à son prédécesseur, le GPT-3. Il excelle dans la génération de texte de qualité remarquable, que ce soit pour répondre à des questions, rédiger des articles, ou même créer du code informatique. GPT-4 bénéficie d’un réseau de neurones massif composé de 250 milliards de paramètres, surpassant ainsi la capacité de traitement de données textuelles de ses versions antérieures. GPT-4 Turbo est la dernière version, elle est destinée à réduire les cas de “paresse” où le modèle n’accomplit pas une tâche. Renvoie un maximum de 4 096 token de sortie. Chat GPT : 20$ par mois, GPT-4 Turbo, facturation à la consommation, entre $0.001 pour 1 000 tokens (soit environ 750 mots) en entrée et $0.003 pour 1 000 tokens en sortie. Ce paragraphe fait 143 mots.
Test d’un prompt simple sur Chat GPT, Stéphanie Renverseau, mars 2024

GPT est un modèle de langage généraliste, conçu pour générer du texte à partir d’un contexte donné. Il est entraîné sur un vaste corpus de données textuelles et peut être adapté à différentes tâches.

ChatGPT, en revanche, est une version spécialisée de GPT, optimisée pour les conversations. Entraîné sur des données conversationnelles, ChatGPT maintient le contexte des échanges et génère des réponses cohérentes et pertinentes dans un cadre dialogique.

Alors que GPT est un modèle polyvalent capable de générer du texte de haute qualité, ChatGPT est spécifiquement conçu pour offrir une expérience conversationnelle naturelle et fluide.

Test d’un prompt simple sur GPT-4 Turbo, Stéphanie Renverseau, mars 2024
  • Mistral Large (février 2024) : IA développée par Mistral AI, également appelée le chat. Il s’agit d’un modèle de type “constitutional AI”, ce qui signifie qu’il a été conçu avec des principes éthiques et des garanties intégrées pour assurer un comportement responsable et aligné avec les valeurs humaines. Mistral a été entraîné à l’aide de la technique d’apprentissage par renforcement avec feedback humain (Reinforcement Learning with Human Feedback, RLHF), qui vise à aligner le modèle sur les préférences et les valeurs des utilisateurs. Cette approche permet à Mistral, en partenariat avec Microsoft, permet de générer des réponses de haute qualité tout en minimisant les risques de générer du contenu inapproprié ou préjudiciable. Il dispose d’une fenêtre de contexte de 32k tokens. Facturation à la consommation, entre 7,30€ (entrée) et 22€ (sortie) par million de tokens (soit entre 0,000073 € et 0,000022 € par token) pour la version Large.
Test d’un prompt simple sur Mistral Large, Stéphanie Renverseau, mars 2024
  • Gemini 1.5 (anciennement BARD — février 2024) prononcer Géminaï : IA générative et multimodale, de type transformeur, créée par Google, annoncée lors de la conférence I/O destinée aux développeurs en juin 2023, puis présentée au public le 7 décembre 2023. Gemini est gratuit.
Test d’un prompt simple sur Gemini 1.5, Stéphanie Renverseau, mars 2024
  • Qwen 1.5 (août 2023) : Les dernières versions d’IA d’Alibaba Cloud intitulées Qwen-VL, pour “Qwen Large Vision Language Model”, et Qwen-VL-Chat, sont multimodales, c’est-à-dire qui peuvent prendre en compte plusieurs types de données (texte et image, par exemple), de Qwen-7B et Qwen-7B-Chat, deux outils rendus open source par l’entreprise début août. Disponibles gratuitement en open source, y compris pour des usages commerciaux.
Test d’un prompt simple sur Qwen-VL-Plus, Stéphanie Renverseau, mars 2024
  • Claude 3 (mars 2024) : Nouvelle famille de grands modèles de langage (LLM) développés par Anthropic. La suite Claude 3 comprend trois modèles différents : Opus, Sonnet et Haiku. Ces modèles offrent des améliorations en termes de précision, de performance, de vitesse et de rentabilité. L L’introduction de ces modèles marque une étape importante dans le domaine de l’IA, Anthropic positionnant Claude 3 comme un concurrent d’autres modèles d’IA de premier plan tels que le GPT-4 d’OpenAI. Claude 3 n’est pas encore accessible en France, Claude Pro : 20$ par mois.
Test d’un prompt simple sur Claude 3, plateforme Aurora by Tomorrow Theory, Stéphanie Renverseau, mars 2024

Les IA images :

  • DALL-E 3 (aout 2023), la dernière itération du modèle révolutionnaire d’OpenAI, repousse les limites de la génération d’images à partir de descriptions textuelles. Grâce à ses capacités avancées, DALL-E 3 produit des résultats époustouflants, alliant réalisme et créativité à un niveau inégalé. Cette technologie de pointe ouvre de nouvelles perspectives passionnantes dans les domaines de la création visuelle et du design, permettant aux utilisateurs de générer des images uniques et saisissantes à partir de simples descriptions en langage naturel. Facturation à la consommation, entre $0.040 et $0.120 par image.
Test d’un prompt simple sur DALL.E 3, Stéphanie Renverseau, mars 2024
  • Midjourney v6 (fin 2023), Les images générées par Midjourney se distinguent souvent par leur créativité, leur esthétique unique et leur niveau de détail impressionnant. Le modèle est capable de créer une grande variété de styles visuels, allant des illustrations réalistes aux œuvres d’art abstraites en passant par les paysages surréalistes. Les utilisateurs peuvent affiner leurs résultats en ajustant les paramètres et en fournissant des retours au modèle pour obtenir des images qui correspondent à leur vision. La dernière version permet une meilleure prise en compte des prompts, une qualité d’image globalement améliorée, et de nouvelles capacités pour la génération de mots et textes. Accessible via l’application discord, la plateforme étant en bêta avec accès limité (environ 200 images par mois), à partir de 10$ par mois.
  • Firefly 2 (mars 2023) : l’IA d’Adobe qui crée des images à la demande, des typographies personnalisées ou de retoucher des visuels. Le modèle 2 présente de nouvelles fonctionnalités, notamment : le Generative Match, qui permet de télécharger ou de sélectionner une image pour servir de base à la génération d’une nouvelle image; le Photo Settings, qui permet à un utilisateur d’ajuster et d’appliquer des paramètres de photo qui ressemblent à ceux des commandes manuelles de l’objectif de l’appareil photo; et le Prompt Guidance, qui aide les utilisateurs à obtenir les résultats qu’ils souhaitent lors de la rédaction de leurs messages-guides (prompt). Adobe s’engage à faire preuve de transparence concernant le contenu généré via Firefly, ainsi, lors du téléchargement ou du partage de contenu généré des informations de traçabilité du contenu sont appliquées pour informer les personnes qu’il a été généré à l’aide de l’IA. Ces informations de traçabilité du contenu incluent l’utilisation d’une image de référence la votre création, le cas échéant. Firefly est gratuit dans la limité de 25 crédits par mois, et peut être utilisée davantage avec une formule Premium ou Express Premium.
Test d’un prompt simple sur Firefly, Stéphanie Renverseau, mars 2024

Voici le prompt testé pour les images, sans spécification de style particulier, sans itération, pour une comparaison sur la même base :

Imagine a futuristic and inspiring image that symbolises the harmony between artificial intelligence (AI) and language generation interfaces (LGI). At the centre is a stylised, luminous human brain, surrounded and connected by circuits and lines of digital code, representing the integration of AI into human understanding and communication. The circuits mingle with natural elements such as leaves and branches, illustrating how AI technology can merge with humanity and enrich our daily lives. This image conveys a message of optimism about the future possibilities for collaboration between humans and artificial intelligence, highlighting innovation and growth, 4:1 format.

IA vidéos :

  • HeyGen (septembre 2023) : un outil IA qui permet de générer des vidéos et des voix grâce à l’intelligence artificielle. L’objectif de la solution est de simplifier la création de vidéos, en proposant des outils pour travailler l’image, mais également le son et ainsi obtenir une vidéo de grande qualité en quelques minutes seulement : présentation de produit, vidéo de formation, etc. HeyGen propose la création d’un avatar professionnel à votre effigie; la création d’un clone vocal, capable de synthétiser votre voix pour vous faire parler artificiellement; de la traduction via doublage d’une vidéo en modifiant le mouvement des lèvres pour l’adapter à la langue choisie; et la création d’images animées permettant d’animer et faire parler une photo portrait afin de lui donner vie.
  • SORA (bêta février 2024) : IA révolutionnaire d’Open IA capable de produire des vidéos longues, pouvant atteindre une minute, à partir de simples descriptions textuelles. Les séquences générées par SORA se distinguent par leur réalisme et leur cohérence, en particulier lorsqu’il s’agit de représenter des scènes de la vie quotidienne. Bien que l’outil ne soit pas encore totalement au point, OpenAI fait preuve de prudence et anticipe déjà de nombreuses phases de test pour garantir une utilisation éthique et sécurisée de SORA, limitant ainsi les risques d’abus potentiels. En comparaison avec d’autres modèles de génération vidéo comme Pika ou Runway Gen 2, qui ne produisent que des clips de quelques secondes, SORA se démarque par sa capacité à générer des vidéos d’une minute entière, riches en détails et en nuances. Cette prouesse technique ouvre de nouvelles perspectives passionnantes pour l’avenir de la création vidéo assistée par l’IA.
  • EMO (février 2024) : IA d’Alibaba capable de donner vie aux portraits pour faire chanter les personnes qui y figurent. Créé par la branche scientifique d’Alibaba, cet outil génère des vidéos au réalisme impressionnant. Pour faire simple, il suffit de lui octroyer un portrait et, lors d’une “synthèse audio et vidéo avancée”, la personne dessus se met à chanter.

Quelques autres IA :

  • Suno (novembre 2023) : plateforme qui utilise l’IA pour transformer vos idées en réalité sonore. Que ce soit pour créer de la musique, des paroles ou des effets sonores imaginatifs, Suno se présente comme votre baguette magique pour la création audio. D’utilisation simple, il suffit d’écrire en langage naturel les instructions dans le champ de saisie prévu à cet effet : style musical, émotion souhaitée, thème de la chanson, etc. Suno peut également génèrer des paroles aléatoires et créer la musique et procède à l’arrangement qui correspondent. L’utilisateur peut ajuster le rendu pour avoir la chanson parfaite. Quelques mois après son lancement, Suno AI avait déjà décroché un partenariat avec Microsoft. L’IA musicale pourrait alors s’associer avec Copilot…Gratuit à hauteur de 50 crédits à renouveler quotidiennement (10 chansons).
  • Hume (avril 2023) : une application d’IA capable d’analyser les émotions et comportements humains à travers des vidéos et enregistrements vocaux. La vidéo est en temps réel et les émotions sont analysées en utilisant la webcam de l’ordinateur par exemple. Cette expérience pousse à réfléchir profondément sur les implications d’une telle technologie.
  • ElevenLabs (bêta janvier 2023) : est un générateur de voix par IA qui s’appuie sur la technologie de synthèse vocale : Text to Speech (TTS). L’outil vous permet de créer des voix synthétiques dans 29 langues différentes, de cloner votre propre voix mais aussi de demander une traduction vocale de vidéos ou de livres audio. ElevenLabs dispose du Text to Speech : l’outil vocal est capable de détecter les nuances de texte et de créer des voix synthétiques avec une intonation d’humain et une résonance précise; et du Dubbing : il s’agit d’une option de traduction vocale qui permet de remplacer le son d’une vidéo ou d’un livre audio dans une nouvelle langue. Version gratuite : jusqu’à 10 000 caractères et 3 voix

L’Intelligence Artificielle a connu des progrès spectaculaires ces dernières années, repoussant sans cesse les limites de ce qui semblait possible. Des IA conversationnelles toujours plus sophistiquées aux prouesses de la génération d’images et de vidéos, en passant par des applications plus spécialisées, l’IA s’impose comme une technologie incontournable, appelée à transformer en profondeur notre société.

Cependant, malgré ces avancées remarquables, l’émergence d’une véritable Intelligence Artificielle Générale reste encore du domaine de la spéculation. Si les progrès actuels nous en rapprochent, de nombreux défis techniques et théoriques subsistent, sans compter les questions éthiques et sociétales que soulève cette perspective.

Dans un prochain article, j’explorerai plus en détail les capacités actuelles de l’IA et ses développements futurs, notamment l’éventuelle émergence de l’IAG et les enjeux qui l’accompagnent. Car s’il est essentiel de mesurer le chemin parcouru, il est tout aussi crucial d’anticiper les défis à venir pour façonner une IA au service de l’humain et du bien commun.

[Article écrit en mars 2024 par Stephanie Rebecca Renverseau avec le soutien de l’IA pour environ 30%. Images créées avec DALL.E 3 et Midjourney v6, tous droits réservés].

J’espère que cet article vous a plu, n’hésitez pas à le partager avec le monde entier !

En termes clairs

Si vous vous intéressez à la combinaison de l’IA avec les RH, aux enjeux liés à l’émergence du métavers, de la blockchain, du web3 et plus largement des nouvelles technologies, sujets sociétaux, je vous invite à vous abonner à la newsletter dédiée sur le sujet, et à lire les articles écrits régulièrement :

--

--