Nvidia, ce sont bien sûr des cartes graphiques pour les joueurs comme la toute récente GeForce RTX5070. Mais si les GPU gaming demeurent importants pour l’entreprise — dont c’est le cœur de métier, après tout —, cette activité a largement cédé sa place à l’IA. Et durant la GPU Technology Conference (GTC) qui se tient en Californie jusqu’au 21 mars, Nvidia a creusé ce sillon en présentant de nombreuses nouveautés.
Un GPU, plusieurs puces, plus de puissance
À commencer par une famille de GPU nouvelle génération baptisée Vera Rubin, en hommage à l’astronome américaine connue pour ses travaux sur la matière moire. Ces GPU, qui apparaitront au second semestre 2026, comprennent en fait un CPU (Vera) et un nouveau design GPU (Rubin). Vera est le premier processeur mis au point par Nvidia, basé sur un design baptisé Olympus ; auparavant, l’entreprise utilisait des composants Arm.
Cette conception maison permet à Vera d’être deux fois plus rapide que le CPU à l’œuvre dans les puces Grace Blackwell, assure Nvidia qui change aussi la définition de ce qu’est un GPU : un ensemble de puces regroupées sera maintenant considéré comme plusieurs GPU distincts.
Par exemple, la puce Blackwell du marché est composée de deux puces assemblées pour fonctionner comme une seule unité. Avec la nouvelle génération Rubin, Nvidia considère désormais qu’un GPU constitué de plusieurs puces (dies) doit être comptabilisé comme plusieurs GPU distincts. Rubin se compose de deux dies, donc deux GPU. En 2027, la famille Rubin Next regroupera quatre dies sur une seule puce, elle sera présentée comme autant de GPU. Nvidia voit loin, puisque la génération d’après Rubin est déjà connue : il s’agira de Feynman, attendue en 2028.
Mais revenons à la première génération de Rubin prévue l’année prochaine. Combiné à Vera, un GPU Rubin pourra produire jusqu’à 50 petaflops en inférence, le processus par lequel un modèle IA entraîné applique ses connaissances pour analyser de nouvelles données et produire des résultats en temps réel. C’est plus du double des 20 petaflops de la génération actuelle Blackwell. De plus, Rubin pourra prendre en charge jusqu’à 288 Go de mémoire rapide, un critère clé pour les développeurs d’IA.

Nvidia a également dévoilé Blackwell Ultra, une évolution de la gamme actuelle capable de générer plus de contenu en moins de temps. Elle sera proposée en plusieurs configurations, y compris une version avec un CPU Nvidia Arm (GB300) et une version avec huit GPU par serveur. Le constructeur affirme que ces puces permettront aux fournisseurs de cloud d’augmenter jusqu’à 50 fois (!) leurs revenus par rapport à la génération Hopper.
Blackwell Ultra est particulièrement adapté aux modèles d’IA de « raisonnement » comme peuvent l’être ceux du chinois DeepSeek, qui effraie tant les géants US. Nvidia, visé au premier chef par cette offensive, a au contraire choisi d’embrasser ces modèles et pour cause : les « agents » IA font massivement appel à l’IA de raisonnement… et donc, à des technologies capables de les mouliner.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.
Source : Nvidia