La recherche française face à chatGPT
Dans l’effervescence des intelligences artificielles basées sur des modèles de langue, la France et l’Europe paraissent aujourd’hui peu présentes. Pourtant, les communautés de recherche françaises possèdent une expertise forte de ce sujet et ont contribué à une technologie libre et ouverte comparable à GPT-3 : le modèle Bloom.
ChatGPT, Bard, Midjourney, Ernie, Stable Diffusion… Depuis quelques mois, les intelligences artificielles (IA) génératives de texte ou d’image se multiplient, bousculant de nombreux métiers créatifs ou techniques. Leur adoption suscite de multiples questions, sur son impact sur les emplois, la manière dont elles ont été entraînées, leur propension à « halluciner » en inventant de fausses « informations »… C’est pour répondre à quelques-unes de ces questions et penser le futur que le CNRS, sollicité par plusieurs entreprises françaises, a organisé un déjeuner dédié à la question.
Depuis fin 2022, le club CNRS Entreprises du CNRS (voir encadré) aide en effet les dirigeants et dirigeantes à saisir les nouveaux enjeux scientifiques et les changements que la science pourrait apporter au monde socio-économique. En accès restreint, ce format permet aux entreprises invitées de partager leur compréhension des tendances et d’échanger en même temps avec un chercheur ou une chercheuse spécialiste du domaine. Celui-ci, organisé dès la mise à disposition de chatGPT par l’entreprise OpenAI, a rassemblé 15 représentants d’industriels comme Servier, EDF, Alstom, Google ou Thalès, pour échanger sur leurs pratiques et leurs réflexions autour de l’utilisation de l’IA. Confidentialité des données et droits applicables, automatisation et optimisation des processus, gestion de larges masses de données, explications des décisions prises par l’IA (« explicabilité »), réticence des utilisateurs finaux ou encore applications variées furent au coeur des débats, suite à une présentation par Christophe Cerisara, chercheur CNRS au Laboratoire lorrain de recherche en informatique et ses applications (Loria).
Le club CNRS Entreprises
Le CNRS a lancé fin 2022 un club de dirigeants et dirigeantes, qui vise à permettre à toutes les parties prenantes d’échanger, de manière informelle et bienveillante, autour des défis auxquels fait face notre société et des solutions que peuvent proposer les scientifiques et le CNRS. Ce Club CNRS Entreprises est conçu comme une communauté d’individus invités par le CNRS parce qu’ils s’intéressent à l’innovation et à la science, et occupent un poste stratégique dans une entreprise (start-up, PME, grands groupes, etc.) ou une organisation (fédérations, médias, institutions, sociétés d’innovation, etc.). Il propose différentes rencontres pour donner à ces dirigeants et dirigeantes un accès privilégié à la science et à la recherche « en train de se faire », et les aider à comprendre ces sujets complexes : des visites de laboratoires ou d’infrastructures (côté CNRS ou entreprises), des petits déjeuners une fois par mois pour décrypter un sujet de recherche et en montrer les enjeux et les impacts sur le monde socio-économique, ou encore des déjeuners de travail sur des sujets qui peuvent faire débat. Un agenda résume notamment les rendez-vous à venir, adaptés aux souhaits de la communauté.
Pour faire partie de la communauté, contactez Sabrina Biarrotte-Sorin, directrice du Club Entreprises : sabrina.biarrotte-sorin@cnrs.fr
Une expertise reconnue
Expert en traitement automatique du langage naturel et en deep learning, celui-ci a notamment insisté sur le fait que « la vraie révolution derrière chatGPT est scientifique : c’est l’accumulation des connaissances du monde au sein des modèles » – des modèles encore mal compris et qui nécessitent une recherche fondamentale importante. « J’ai participé à ce déjeuner pour en apprendre plus sur la recherche fondamentale derrière l’IA générative, connaître ses limites et perspectives. », explique Olivier Senot, directeur de l’innovation du groupe Docaposte, branche numérique du groupe La Poste qui propose une gamme d’offres pour gérer les échanges professionnels de documents. « Je me devais d’être présent pour apporter la vision d’un groupe industriel qui a son propre prisme de regard sur cette technologie promettant de révolutionner les processus et les métiers. », ajoute-t-il, notant une « accélération de l’innovation entre les annonces et les applications ». Celle-ci pose des questions sur l’impact sur la société et les industriels : « Nous sommes aujourd’hui plus dans la réaction que dans l’anticipation dont nous avons l’habitude. Mais nous sommes structurés pour répondre rapidement et pensons concrétiser nos premières offres pour nos clients cet été, en plus d’utiliser l’IA pour améliorer notre efficacité opérationnelle interne. », détaille Olivier Senot.
Chez Berger-Levrault aussi, l’adaptation a été rapide. Depuis plusieurs années, cet industriel du logiciel a des liens forts avec la recherche et notamment deux partenariats stratégiques avec Inria et le CNRS. Éditeur de solutions numériques, il produit et maintient aussi des bases documentaires juridiques à destination des administrations publiques, Legibase. Il a intégré un moteur de réponses, une IA nourrie de connaissances réglementaires fortes, pour aider leurs clients à rechercher les informations les plus pertinentes sur ces produits documentaires en ligne, et réfléchit également à plusieurs autres usages des IA génératives. « Notre entreprise a une culture historique de la gestion des textes et fonds documentaires : il est évident que l’arrivée des IA génératives de texte nous intéresse pour les besoins de nos clients, dont les missions sont importantes pour la société. », résume Valérie Reiner, directrice des Affaires Publiques chez Berger-Levrault.
Le plus gros modèle de langue multilingue et open source
Pour cela, l’équipe menée par Mustapha Derras, directeur Recherche & Innovation, a testé plusieurs modèles de langue. Si l’ex-chercheur juge GPT « en avance sur ses concurrents », il déplore « l’absence d’équivalents européens », en particulier basés sur le modèle Bloom. « Les scientifiques français disposent de très nombreuses solutions. », rappelle-t-il.
« Bloom est un bijou sous-exploité. », concède François Yvon, directeur de recherche CNRS au Laboratoire interdisciplinaire des sciences du numérique1 . L’expert en traitement automatique des langues naturelles dans un contexte multilingue s’est engagé dès le départ dans le projet BigScience, initié par l’entreprise Hugging Face, fondée par trois Français à New York, et impliquant plusieurs centaines de scientifiques en intelligence artificielle issus de 72 pays et des sociétés comme Airbus, Meta AI, Mozilla, Orange Labs ou Naver Labs. En 2022, cette collaboration a donné naissance à Bloom (pour "BigScience Large Open-science Open-access Multilingual Language Model"), un modèle de langue multilingue et open source qui intègre des textes en 46 langues. L’objectif : comprendre comment entraîner, spécialiser, évaluer un modèle, en détecter les biais.
« Il suffirait qu’une entreprise s’en empare »
« Bloom présente des performances comparables aux autres modèles disponibles au moment de sa publication, mais il a été entraîné sur un corpus multilingue plus divers que la référence GPT-32 . », détaille le chercheur qui a contribué à l’évaluation des capacités multilingues du modèle, tout en participant au comité de suivi français mis en place à la demande du CNRS – dont le supercalculateur Jean Zay a entraîné le modèle – et du ministère de l’Enseignement supérieur et de la Recherche. Mais « il s’agissait d’un projet de recherche, aujourd’hui terminé, qui n’avait pas vocation à être exploité commercialement et n’a pas été conçu pour être directement utilisable par le grand public ». Un obstacle qui ne nécessiterait qu’un peu de développement informatique : « il suffirait qu’une entreprise s’en empare », le modèle étant disponible sous un nouveau type de licence (voir encadré) qui le permettrait.
Bloom : l’IA responsable
Le modèle Bloom est disponible sur la plateforme de l’entreprise partenaire Hugging Face, avec d’autres modèles similaires ou dérivés. Il peut être téléchargé sous une licence RAIL, pour "Responsible AI License", proposée pour la première fois lors du projet BigScience. Cette licence permet aux développeurs d'empêcher que les logiciels qu'ils développent ne soient utilisés dans des applications nuisibles. Proche des licences open source existantes, elle pose certaines conditions d’utilisation pour un logiciel ou un code source, comme l’interdiction d’une utilisation pour générer de fausses nouvelles ou généralement des textes sans préciser qu’une machine en est à l’origine, pour diffuser des informations privées ou des conseils médicaux.
Sur le site de Hugging Face, Bloom est d’ailleurs téléchargé entre 40 000 et 50 000 fois par mois pour des démonstrations, des projets d’enseignements ou de recherche, « sans doute aussi par des entreprises voulant tester des idées ». Il est particulièrement performant pour effectuer des traductions, grâce à son riche corpus multilingue. Il a surtout l’avantage d’être « exemplaire » en matière de transparence, les bases de données utilisées pour l’entraînement étant connues et interrogeables, et les algorithmes « visibles et documentés ». Il peut ainsi tenir lieu d’alternative à chatGPT – une alternative ouverte, libre et évitant l’exploitation abusive de données personnelles – et pourrait être spécialisé pour des activités particulières ou sur des corpus propriétaires d’entreprises ou d’organisations.
« Le modèle Bloom est la seule initiative européenne comparable aux développements conduits aux États-Unis et ailleurs. Par son soutien à ce projet complexe sans bénéfice immédiat, le CNRS a permis de mettre en évidence la recherche française dans la communauté internationale de l’intelligence artificielle générative. », tient à préciser François Yvon. L’Agence nationale de la recherche et la Commission européenne ont depuis lancé des appels à projets, notamment pour s’interroger sur l'évaluation des modèles, la détection de leurs biais et l’explicabilité de l’IA, et pour développer des modèles de langue plus efficaces et moins énergivores.
La question de la confiance
Reste une question clé, également abordée au déjeuner innovation : peut-on faire confiance aux réponses fournies par l’IA ? En effet, les algorithmes utilisés fonctionnent souvent comme des boîtes noires et les IA génératives peuvent fournir des réponses trop moyennées, erronées ou biaisées par des préjugés présents dans les données utilisées pour les entraîner. En France comme en Italie ou au Canada, plusieurs plaintes ont été déposées, en particulier contre la société OpenAI et son robot conversationnel chatGPT, et des enquêtes sont ouvertes par la Commission nationale de l'informatique et des libertés (CNIL) et ses équivalents dans les pays concernés. Une tendance qui inquiète aussi bien Mustapha Derras qu’Olivier Senot, préoccupés par le « retard possible pris par rapport à d’autres pays plus permissifs sur les questions de souveraineté, de stockage de données ou de droits d’auteur ».
La stratégie européenne “Artificial Intelligence Act” présentée en avril 2021, qui vise à faire de l’Union européenne une plaque tournante de classe mondiale pour l’IA, veut aussi veiller à ce que l’IA soit « centrée sur l’humain et digne de confiance ». Les modalités de cet objectif vont être revues par le Parlement européen suite à l’arrivée des IA génératives grand public.
Plusieurs chercheurs et chercheuses du CNRS travaillent aussi sur ce sujet. L’explicabilité de l’IA fait ainsi partie des domaines de recherche prioritaires du centre AISSAI. Au sein du programme sur la certification de l’IA du Centre ANITI1 de Toulouse – un des quatre instituts interdisciplinaires d’intelligence artificielle (3IA) mis en place dans le cadre du Programme d’investissements d’avenir du gouvernement – ont par exemple été développés des outils pour évaluer la manière dont une IA prend une décision et certifier l’absence (ou prévenir de la présence) de biais. CNRS Formation Entreprises, l’organisme de formation continue du CNRS, propose d’ailleurs des formations aux entreprises et scientifiques sur ces outils.
- 1Artificial and Natural Intelligence Toulouse Institute.
Au-delà des modèles de langue
Si l’IA générative est au cœur des débats aujourd’hui, le CNRS est aussi pleinement investi dans le développement d’autres types d’intelligences artificielles qui apportent des nouveautés dans de nombreux domaines scientifiques et industriels. En particulier, il soutient ou est impliqué dans près de 100 start-up utilisant l’intelligence artificielle dans la santé, l’éducation, le divertissement, l’analyse d’images satellites (comme Preligens) ou encore l’optimisation agricole.
Par exemple, DAMAE Medical développe ainsi un système d'imagerie de pointe, le dispositif médical deepLive™, pour la détection précoce des cancers de la peau et le diagnostic de multiples affections cutanées. Issue du Laboratoire Charles Fabry (CNRS/IOGS), avec l’aide d’une bourse européenne EIC Accelerator, elle a valu à sa présidente Anaïs Barut une nomination parmi les Forbes 30 Under 30 en 2021. De son côté, la start-up Aquemia1 fait la synthèse entre physique quantique et IA pour accélérer la conception de molécules thérapeutiques, et multiplie les récompenses et levées de fonds.
Kurage utilise l’IA pour aider des personnes handicapées à se mouvoir via des équipements de fitness adaptés et à des vêtements intelligents. Elle a bénéficié du programme RISE du CNRS, tout comme HawAI.tech2 qui conçoit des accélérateurs matériels pour fournir une IA explicable, à faible coût énergétique, capable d’effectuer un calcul efficace localement près d’un capteur – une start-up classée parmi les 100 où investir en 2023 d’après le magazine Challenges. Autre exemple : lauréate des Prix de l'innovation au CES 2022 – salon considéré comme l'un des plus importants événements de l'industrie technologique – GrAI Matter Labs, issue de l’Institut de la vision3 , s’inspire du cerveau pour une IA en temps réel. À titre d'illustration, l’intelligence artificielle a aussi récemment permis d’avancer dans la compréhension de l’odorat.
- 1Issue du laboratoire Processus d'activation sélectif par transfert d'énergie uni-électronique ou radiatif (CNRS/ENS-PSL/Sorbonne Université).
- 2Issue des laboratoires C2N (CNRS/Université Paris-Saclay), G-SCOP (CNRS/Université Grenoble Alpes) et ISIR (CNRS/Sorbonne Université).
- 3CNRS/Inserm/Sorbonne Université.