Les défis de la mise à l’échelle de l’IA générative

Cedric Clouchoux
neoxia
6 min readMay 27, 2024

--

Dans un paysage technologique en constante évolution, l’intelligence artificielle générative se profile comme une force motrice de l’innovation, mais son adoption généralisée est entravée par des défis majeurs. Au delà des considérations techniques, les entreprises sont confrontées à des obstacles tels que la gestion du changement, la complexité de la gouvernance de l’IA, et le manque de mesures précises du retour sur investissement. Une approche possible, par cas d’usages, permet de tester des solutions spécifiques tout en encourageant une vision holistique à l’échelle de l’entreprise, afin de structurer la transformation organisationnelle. En parallèle, une compréhension approfondie de l’IA générative et de ses limitations, ainsi que des mesures de contrôle de qualité des données et des modèles, sont essentielles pour garantir des résultats optimaux dès les premières étapes du projet, optimisant le passage à l’échelle.

L’intelligence artificielle et plus particulièrement l’IA générative est au coeur des préoccupations des industriels, des chercheurs et même des états. L’écosystème foisonnant de la GenAI est caractérisé par un rythme d’innovations encore jamais vu dans aucun domaine technologique. Chaque semaine, presque chaque jour, de nouveaux modèles plus performants les uns que les autres sont présentés et éprouvés sur une multitude de cas d’usage. Cependant, cette technologie est encore aux prémices d’une utilisation réfléchie, efficace et responsable. Bien que certains secteurs comme le développement informatique aient déjà pu en tirer des bénéfices sur le plan opérationnel, les organisations sont souvent dans une situation ambigüe, entre tests multiples, attente d’une démonstration de la véritable plus-value de l’IA générative sur le long terme et freins à la mise à l’échelle. Les obstacles, bien réels, doivent être adressés au plus tôt afin d’assurer une intégration cohérente de l’IA.

L’adoption réelle de l’IA Générative

De nombreux prototypes ont été et sont développés, utilisant l’IA générative pour répondre à des besoins précis. De l’assistant virtuel spécialisé au résumé de volumes phénoménaux de textes, en passant par l’analyse de process et recommandation pour optimisations, ces démonstrateurs répondent à un large panel de cas d’usage. Une grande majorité des entreprises de la tech a ainsi déjà exploré ces technologies par des projets pilotes. En revanche, la mise en production et le passage à l’échelle se heurtent à un certain nombre de facteurs ralentissant une transformation plus globale :

  • Le premier obstacle majeur réside dans la gestion du changement : les solutions envisagées par l’IA générative peuvent entraîner des transformations profondes au sein des organisation et des métiers, nécessitant une anticipation et une gestion précoces de la part des entreprises, au niveau RH, financier ou encore process.
  • La gouvernance de l’IA, bien que plus encadrée et réglementée (European AI Act par exemple), reste complexe à implémenter : les risques en matière de sécurité, d’éthique et de protection de la propriété intellectuelle sont réels et doivent être considérés dès les premières phases d’un projet, tant par les fournisseurs de solutions que par les utilisateurs finaux.
  • L’absence de mesures précises du retour sur investissement (ROI) complique la justification des investissements nécessaires pour passer à une production à grande échelle.
  • Les coûts de mise en place initiale, d’exploitation et de maintenance à long terme, peuvent également constituer un frein significatif à une adoption de l’IA générative à grande échelle. Les coûts d’inférences mais également de réentraînement des modèles sont régulièrement négligés ou minimisés lors des phases préparatoires de mise à l’échelle.
  • Les données utilisées lors des phases de preuve de concept ou prototypes sont souvent des données synthétiques, idéalisées et propres. Le passage sur des données réelles peu diminuer drastiquement les performances du système, réduisant d’autant l’enthousiasme des phases de test.
  • Plus globalement, la mécanique de l’IA générative diffère des approches déterministes habituellement utilisées, pouvant représenter une barrière à l’adoption.

Contrôler la qualité des données

Bien que chacun de ces obstacles nécessite une réponse, s’il fallait prioriser ces problématiques, celle des données devrait être au centre de toutes les attentions. Les données sont en effet au coeur des systèmes d’IA, garantissant la performance des modèles. Maîtriser leur qualité et leur pertinence est essentiel pour réduire le risque de problèmes lors du passage en production, en particulier sur les données utilisées pour de l’entraînement, du fine-tuning ou du RAG. Les LLMs ont la particularité d’être entraînés sur des gigantesques corpus de données, leur conférant une étendue de connaissances extrêmement large. La contrepartie est que dans les cas où un savoir spécifique et expert est nécessaire, ces LLMs se révèlent peu performants. Pour remédier à ce défaut, les techniques de spécialisation de modèles comme les RAGs (Retrieval-Augmented Generation) ou le fine-tuning ont été mis au point. Dans le cas du RAG, de nouvelles données sont utilisées pour apporter une spécialisation (souvent métier) au LLM et permettre des inférences plus pertinentes. La base documentaire spécialisée étant de taille moindre en comparaison de celle utilisée pour l’entraînement du LLM, ces données se doivent d’être d’une grande qualité, le moindre défaut pouvant résulter en un biais dans les réponses générées par le modèle. Cette gestion de la qualité de la donnée doit être implémentée dès l’étape du prototype, afin de garantir des résultats optimaux.

Toujours en lien avec les données, les prototypes ou preuves de concept utilisent très souvent des données d’entrées non réelles, des bases de données synthétiques ou des données terrain sélectionnées pour leur bonne qualité. Ce choix est fait pour se concentrer sur le modèle en lui-même, et permet de réduire les erreurs d’inférence. Pourtant, le passage à l’échelle se fait toujours sur des données terrain réelles, peu ou non filtrées. Par conséquent, une fois la phase prototype terminée et la mise en production entamée, les résultats obtenus sont très souvent décevants, le système d’IA nécessitant un travail conséquent supplémentaire de mise au point pour s’adapter à son environnement réel. La conséquence est double : le délai de mise en production s’allonge (ainsi que les coûts liés au projet), et les mauvais résultats du modèle découragent les organisations d’investir dans de tels systèmes, car peu fiables en environnement réel. Il est donc indispensable d’utiliser des données terrain réelles au plus tôt, y compris lors des premières preuves de concept. Dans les cas où ces données ne sont pas disponibles à l’étape prototype (en particulier dans les industries régulées comme les secteurs de la santé, du transport ou bancaire), une phase supplémentaire, dédiée à l’intégration et la préparation de ces données, doit être prévue en amont de la mise en production.

Intégrer la GenAI de manière pertinente et organisée

De façon plus macroscopique, l’intégration des processus, applications ou encore assistants à base d’IA générative doit être programmée en amont afin d’harmoniser l’adoption de ces outils dans l’ensemble de l’organisation et de préparer de façon efficace les métiers aux changements futurs que cette technologie implique. L’approche par use-cases actuellement privilégiée permet de tester en conditions presque réelles de nouvelles solutions et d’adresser des besoins précis, rapidement et à faible coût. L’important est alors de ne pas laisser ces initiatives isolées mais bien d’encourager cette approche à l’échelle de l’organisation, afin d’aller vers une stratégie “String-of-Pearls”, structurant alors la transformation de l’organisation dans sa globalité. En parallèle, les CxOs, en partenariat étroit avec les Directions Techniques et les Ressources Humaines, doivent oeuvrer dans le sens d’une adoption homogène, sécurisée et responsable de ces nouvelles technologies, tout en restant réalistes sur les attentes placées dans ces changements.

D’un point de vue technique, la compréhension approfondie de l’IA dans son ensemble, de l’IA générative en particulier, de son rôle et de ses limitations est indispensable. Par exemple, la mise en place de métriques permettant d’appréhender l’adoption et la pertinence de la GenAI doit être l’une des premières étapes dans un projet. Des KPIs sur plusieurs niveaux peuvent être incorporés, évaluant notamment les modèles (performances et sécurité des inférences), le système IA dans son ensemble (end-to-end, incluant en particulier la gestion des données) ou encore l’impact business (taux d’adoption, fréquence d’utilisation, satisfaction utilisateur).

L’adoption de l’IA générative, envisagée et amorcée par de nombreuses organisations, repose sur des prérequis indispensables : une définition claire du problème et de ses attentes, une implication précoce des métiers concernés dans le processus de réflexion et de conception ainsi qu’une gestion efficace des données. De plus, la question d’aborder l’IA générative par des prototypes peut se poser : bien que permettant de tester la faisabilité à faible coût, les barrières à la mise à l’échelle sont importantes. L’investissement initial pour la mise en place d’applications fiables à l’échelle peut être plus ou moins important selon les projets et les organisations, mais reste nécessaire afin de dépasser le stade de test et apporter la puissance de ces technologies au service de l’entreprise.

--

--

Cedric Clouchoux
neoxia
0 Followers
Writer for

Currently Head of AI, tech & AI for health & life sciences lover, former academic dude