Железо15 марта 2026 г.5 мин чтения

NVIDIA GTC 2026: платформа Vera Rubin и будущее AI-вычислений

На конференции GTC 2026 в Сан-Хосе NVIDIA представила платформу Vera Rubin — шесть новых чипов и AI-суперкомпьютер, обеспечивающие 10-кратное снижение стоимости инференса по сравнению с Blackwell.

NVIDIA GTC 2026: платформа Vera Rubin и будущее AI-вычислений

На ежегодной конференции GTC 2026, проходящей с 16 по 19 марта в Сан-Хосе, Калифорния, NVIDIA представила свою новейшую AI-платформу Vera Rubin — прямого наследника архитектуры Blackwell.

Шесть чипов, один суперкомпьютер

Платформа Vera Rubin объединяет шесть новых чипов в единую экосистему. Суперчип Vera Rubin комбинирует один CPU Vera и два GPU Rubin в одном процессоре. Это обеспечивает радикальное улучшение производительности и энергоэффективности для задач машинного обучения.

10-кратное снижение стоимости инференса

Ключевое достижение Vera Rubin — 10-кратное снижение стоимости инференса токенов и 4-кратное сокращение количества GPU, необходимых для обучения моделей Mixture-of-Experts (MoE), по сравнению с архитектурой Blackwell.

NVIDIA позиционирует платформу как идеальное решение для агентного AI, продвинутых моделей рассуждения и MoE-моделей, которые объединяют серию «экспертных» ИИ и направляют запросы к подходящему эксперту в зависимости от задачи.

Доступность

Чипы Rubin уже находятся в полном производстве. Продукты на базе Vera Rubin будут доступны от облачных партнёров — AWS, Google Cloud, Microsoft Azure и OCI, а также CoreWeave, Lambda, Nebius и Nscale — во второй половине 2026 года.

Источник:NVIDIA Newsroom
#NVIDIA#GTC 2026#Vera Rubin#GPU#инференс#железо