модели18 марта 2026 г.

NVIDIA представила платформу Vera Rubin: 7 чипов, суперкомпьютер и новая эра агентного ИИ

На конференции GTC 2026 в Сан-Хосе Дженсен Хуанг анонсировал полностековую платформу Vera Rubin из семи чипов, пяти стоечных систем и суперкомпьютера для агентного ИИ. Производительность инференса выросла до 10 раз по сравнению с Blackwell, а AWS разворачивает более 1 миллиона GPU NVIDIA.

NVIDIA представила платформу Vera Rubin: 7 чипов, суперкомпьютер и новая эра агентного ИИ

На конференции NVIDIA GTC 2026, проходящей 16–19 марта в Сан-Хосе, генеральный директор Дженсен Хуанг представил платформу Vera Rubin — полностековую вычислительную систему нового поколения, включающую семь чипов, пять стоечных конфигураций и один суперкомпьютер. Платформа названа в честь американского астронома Веры Рубин и является преемником рекордной архитектуры Blackwell. По словам Хуанга, это «гигантский скачок к следующему рубежу ИИ» благодаря экстремальной совместной оптимизации шести чипов.

Ключевые компоненты платформы — процессор Vera CPU, GPU Rubin с вычислительной мощностью 50 петафлопс в формате NVFP4, коммутатор NVLink 6, сетевая карта ConnectX-9 SuperNIC, процессор обработки данных BlueField-4 DPU и Ethernet-коммутатор Spectrum-6. Пропускная способность NVLink достигает 3,6 ТБ/с на GPU, а стойка Vera Rubin NVL72 обеспечивает суммарную полосу в 260 ТБ/с. Сборка системы ускорена до 18 раз по сравнению с предшественником.

Платформа обещает революционное снижение стоимости инференса — до 10 раз по сравнению с Blackwell. Для моделей на основе архитектуры Mixture-of-Experts требуется в 4 раза меньше GPU. Энергоэффективность сетевой подсистемы Spectrum-X улучшена в 5 раз относительно традиционных решений. Продукты на базе Rubin станут доступны во второй половине 2026 года через AWS, Google Cloud, Microsoft Azure, Oracle Cloud, CoreWeave, Lambda и других партнёров.

Помимо Vera Rubin, NVIDIA анонсировала архитектуру следующего поколения Feynman с новым процессором Rosa (в честь Розалинд Франклин), а также инициативу Space Computing — системы Space-1 на базе Vera Rubin, которые перенесут ИИ-дата-центры на орбиту. Настольная станция DGX Station GB300 с 748 ГБ когерентной памяти и производительностью до 20 петафлопс FP4 уже поставляется первым разработчикам, включая Андрея Карпатого.

В области программного обеспечения NVIDIA представила открытый стек NemoClaw для безопасного запуска автономных агентов, а также коалицию Nemotron из шести семейств фронтирных моделей: Nemotron, Cosmos, Isaac GR00T, Alpaymayo, BioNeMo и Earth-2. Эти модели охватывают языковой ИИ, робототехнику, автономное вождение, биологию и климатическое моделирование. Платформа IGX Thor для физического ИИ на промышленном краю уже используется компаниями Caterpillar, Hitachi Rail и Johnson & Johnson.

Масштаб развёртывания впечатляет: AWS разворачивает более 1 миллиона GPU NVIDIA, включая архитектуры Blackwell и Rubin. Облачные партнёры NVIDIA удвоили мощности ИИ-фабрик за год — совокупно более 1 миллиона GPU и 1,7 гигаватт вычислительной мощности по всему миру. Хуанг подчеркнул, что спрос на вычисления вырос в миллион раз за последние годы, а прогнозируемая выручка NVIDIA с 2025 по 2027 год составит 1 триллион долларов. Microsoft Azure станет первым гиперскейлером, развернувшим системы Vera Rubin NVL72.

Попробуйте нейросети в MashaGPT

GPT-5, Claude, Gemini, генерация изображений и видео — всё в одном месте

Попробовать бесплатно
Источник:NVIDIA Newsroom