Ce mardi 21 mai 2024, OpenAI a organisé son premier événement à Paris. La présentation, menée d’une main de maître par Olivier Godement, le directeur des API d’OpenAI, et Romain Huet, le directeur de l’expérience développeur, avait essentiellement pour but de séduire la communauté de développeurs présents en France. Parmi les invités, on a d’ailleurs croisé de nombreux développeurs et employés d’entreprises susceptibles d’exploiter l’IA dans le cadre de leurs activités.
La conférence a débuté par une courte vidéo de Sam Altman, PDG et cofondateur d’OpenAI. Dans la séquence d’ouverture diffusée sur un écran géant, Altman a loué l’écosystème français, qu’il a qualifié de dynamique. L’entrepreneur, qui regrette de ne pas avoir pu faire le déplacement jusqu’à Paris, affirme avoir été impressionné par les projets nés dans l’Hexagone lors d’une précédente visite en France.
OpenAI vante ChatGPT 4o pour attirer les développeurs
OpenAI revendique jusqu’à trois millions d’utilisateurs mensuels pour les API de ChatGPT. C’est par le biais de ces interfaces de programmation d’application que les développeurs peuvent créer des services qui s’appuient sur l’IA générative. Parmi les principaux outils nés de l’initiative, on trouve le nouveau Microsoft Bing enrichi à l’IA, déployé au début de l’année dernière.
Lors de l’événement, la société américaine est longuement revenue sur la dernière version de ChatGPT, à savoir ChatGPT 4o. Annoncée la semaine dernière, cette itération se distingue surtout par ses capacités multimodales. Pour répondre de la façon la plus naturelle que possible, l’IA repose sur un nouveau modèle entraîné pour combiner différents modes de communication. Devant une audience captivée, OpenAI a démontré tous les cas d’usage de ChatGPT 4o, de la traduction en temps réel en passant par la réalisation d’une image basée sur un dessin réalisé à main levée. Avec ses impressionnantes démonstrations, la start-up veut séduire des développeurs qui semblent déjà conquis.
Dans la foulée, un nouvel aperçu de Sora a été dévoilé. En l’espace de quelques secondes, le générateur de vidéos a créé une séquence très réaliste montrant les rues de Paris durant l’exposition universelle de 1889. De la même manière que Dall-E, Sora fonctionne en synergie avec ChatGPT. Il suffit de s’adresser au robot conversationnel pour concevoir une vidéo de qualité. Par la suite, Romain Huet s’est servi de GPT pour ajouter une voix off sur la séquence en clonant son timbre de voix. Pour mémoire, Sora sortira dans le courant de l’année en cours.
À lire aussi : ChatGPT va faciliter la vie des utilisateurs de Google Drive et Microsoft OneDrive
Des modèles d’IA moins chers
Surtout, OpenAI a évoqué dans les grandes lignes l’avenir de son intelligence artificielle générative. La société américaine s’est engagée à s’atteler à la création de modèles moins chers, ce qui devrait faciliter la démocratisation de l’IA. C’est déjà le chemin emprunté par GPT-4o, qui se veut plus abordable que les itérations ultérieures.
Par ailleurs, OpenAI va mettre à disposition des versions de GPT plus petites. Ces itérations disposeront de moins de paramètres, c’est-à-dire qu’elles auront une capacité de traitement plus limitée. Néanmoins, elles devraient sans problème répondre à la plupart des demandes des utilisateurs. Cette approche vise vraisemblablement à répondre à l’émergence des modèles d’IA open source, capables de tourner sans difficulté sur un ordinateur, ou même un smartphone. Ces modèles réclament moins de puissance de calcul qu’un grand modèle de langage et menacent l’hégémonie des mastodontes de la Silicon Valley. Les autres géants de la tech engagés dans la course à l’IA ont pris le même virage. Google a décliné son modèle Gemini en plusieurs tailles. C’est aussi le cas de Meta. La société de Mark Zuckerberg propose un large éventail de modèles Llama de tailles différentes.
La start-up souhaite faciliter la customisation des modèles d’IA. Dans les mois et années à venir, les développeurs devraient pouvoir plus facilement personnaliser les modèles linguistiques GPT pour concevoir des chatbots taillés sur mesure. Aux yeux d’Olivier Godement, toutes les organisations finiront par disposer de leur propre modèle pour répondre à leurs besoins spécifiques. Plus modestes, certains modèles seront pensés pour réaliser des tâches bien précises.
Ces modèles personnalisés prendront la forme d’agents multimodaux, capables d’interagir avec l’interlocuteur par la voix, l’image ou le texte, prophétise le cadre d’OpenAI. Ces agents devraient pouvoir s’appuyer sur une base de données fournies par l’utilisateur ou le développeur tiers. Grâce à ces données personnalisées, l’IA pourrait offrir des réponses taillées sur mesure à l’internaute. Cet aperçu du futur de l’IA générative rappelle celui offert par Qualcomm, qui a longuement décrit le smartphone de l’avenir, lors de son dernier Snapdragon Summit.
Des nouvelles de GPT-5… ou GPT-Next
Enfin, la start-up a brièvement donné des nouvelles de GPT-5, la prochaine grande mise à jour du modèle linguistique derrière ChatGPT. Jusqu’ici, la firme de San Francisco est restée très évasive sur les caractéristiques du prochain modèle. La présentation parisienne d’OpenAI s’est articulée autour de la projection d’une série de slides consacrés à l’évolution des modèles.
Sur ces slides, OpenAI évoque la prochaine version de GPT sous l’appellation de « GPT-Next ». Il pourrait s’agir d’un nom temporaire. Néanmoins, cette mention laisse penser que la firme ne compte pas se contenter d’un simple GPT-5, qui aurait logiquement succédé à GPT-4. Les diapositives d’OpenAI confirment l’arrivée d’un nouveau GPT dans le courant de l’année en cours. Les dernières fuites parlent d’une sortie dans le courant de l’été. Le modèle serait d’ailleurs déjà en cours de test.
Sans surprise, OpenAI confirme avoir de la suite dans les idées. La présentation montre noir sur blanc que d’autres modèles d’IA générative seront déployés ultérieurement, après GPT-Next. Des dépôts de marques avaient d’ailleurs déjà levé le voile sur les plans d’OpenAI à long terme. Par contre, l’entreprise ne communique pas encore de calendrier de lancement pour ces futurs modèles de langage.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.