На конференции GTC 2026, прошедшей 11 марта, компания NVIDIA представила Nemotron 3 Super — открытую языковую модель нового поколения со 120 миллиардами параметров, из которых при инференсе активны лишь 12 миллиардов. Модель предназначена для сложных агентных сценариев и способна работать с контекстным окном в 1 миллион токенов, что позволяет агентам удерживать полное состояние рабочего процесса в памяти без потери цели.
Главное архитектурное нововведение — гибридная архитектура Mamba + Transformer в сочетании с механизмом Mixture-of-Experts. Слои Mamba обеспечивают четырёхкратную эффективность по памяти и вычислениям, а трансформерные слои отвечают за глубокое рассуждение. Технология LatentMoE позволяет активировать четырёх экспертов-специалистов по стоимости генерации одного токена, что делает модель исключительно эффективной при масштабировании.
Ещё два важных прорыва — обучение в формате NVFP4 с первого шага градиента (а не пост-квантизация, как у конкурентов) и встроенное предсказание нескольких токенов одновременно (Multi-Token Prediction), дающее трёхкратное ускорение инференса. На чипах NVIDIA Blackwell в режиме NVFP4 модель работает в четыре раза быстрее, чем в FP8 на предыдущем поколении Hopper, при этом без потери точности.
По результатам бенчмарков Nemotron 3 Super заняла первое место в рейтингах DeepResearch Bench и DeepResearch Bench II, опередив все открытые модели. На SWE-Bench Verified модель набрала 60,47% — лучший результат среди моделей с открытыми весами. Общая пропускная способность выше в пять раз по сравнению с предыдущей версией Nemotron Super и в 7,5 раз по сравнению с Qwen 3.5-122B.
Модель уже взята на вооружение ведущими технологическими компаниями. Среди AI-стартапов — Perplexity, CodeRabbit, Factory и Greptile. Из крупных корпораций — Palantir, Siemens, Dassault Systèmes и Cadence. Облачные провайдеры Google Cloud, Oracle Cloud и CoreWeave обеспечивают инфраструктуру для развёртывания. NVIDIA выпустила модель под открытой лицензией с полным рецептом обучения, что позволяет компаниям из регулируемых отраслей разворачивать её на собственных серверах.
Nemotron 3 Super знаменует важный сдвиг в индустрии: открытые модели по качеству догоняют проприетарные решения, при этом предлагая прозрачность и контроль. Гибридная архитектура Mamba + Transformer может задать новый стандарт для эффективных языковых моделей, сочетая линейную сложность по памяти с мощью механизма внимания. Для российских компаний, стремящихся к импортонезависимости в сфере ИИ, доступность открытых весов и полного рецепта обучения особенно ценна.






