Ce n’est probablement pas par pur hasard qu’OpenAI a levé le voile sur son nouveau modèle de langage, la veille des annonces de Google I/O — le moteur de recherche y fera sans aucun doute étalage de ses nouveautés IA.
En attendant, GPT-4o (o pour « omni ») est présenté comme un pas de plus vers « une interaction homme-ordinateur beaucoup plus naturelle ».
Parler avec un assistant comme s’il était humain
Ce modèle bat au cœur de ChatGPT, qui accepte et génère des combinaisons de texte, d’audio et d’images. La voix du bot répond à son interlocuteur avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation. GPT-4o est également plus performant sur le texte dans les langues autres que l’anglais, et il est bien meilleur dans la reconnaissance d’objets et la compréhension de l’audio. Les améliorations au niveau de la voix sont particulièrement saisissantes, avec des accents et des modulations dignes d’une voix humaine. Troublant…
Ces capacités multimodales sont le fruit de la formation du nouveau modèle qui combine le texte, la vision et l’audio ; jusqu’à présent, trois modèles différents étaient mis à contribution, augmentant ainsi le temps de réponse.
Les capacités texte et images de GPT-4o sont déployées à partir d’aujourd’hui dans ChatGPT, aussi bien chez les abonnés payants que ceux qui y accèdent gratuitement. Ceux qui paient pour ChatGPT Plus bénéficient d’un relèvement de la limite de messages (ils peuvent être 5 fois plus longs). Dans les prochaines semaines, le support de la voix de GPT-4o sera proposé en alpha pour les abonnés payants.
Nouvelle interface et logiciel macOS
Et ça n’est pas tout. OpenAI a aussi dévoilé une nouvelle interface pour la version web de ChatGPT, qui se veut « plus amicale et plus conversationnelle ».
Les utilisateurs de Mac seront aux anges, puisqu’une application macOS est dans les tuyaux ! Disponible normalement dès aujourd’hui pour les utilisateurs payants, elle permettra de converser en texte, mais aussi en audio et en vidéo dans l’avenir grâce à GPT-4o (le Voice Mode de GPT-4 est déjà intégré mais il est moins rapide). Le logiciel sera aussi proposé à tous les utilisateurs, y compris gratuits.
Par l’intermédiaire du raccourci clavier Option + Espace, il sera possible d’afficher la fenêtre du bot. On pourra lui poser une question sans avoir à ouvrir l’application dédiée, et même d’y ajouter des pièces jointes pour enrichir la conversation. Une version du logiciel ChatGPT pour Windows est également en développement.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.