NVIDIA представила Nemotron 3 Super — гибридную модель со 120 млрд параметров и революционной архитектурой LatentMoE

На конференции GTC 2026 компания NVIDIA анонсировала открытую модель Nemotron 3 Super с архитектурой Mamba + Transformer и технологией LatentMoE, которая активирует четырёх экспертов по цене одного токена. Модель заняла первое место в рейтинге DeepResearch Bench и обеспечивает пятикратный прирост пропускной способности.

На конференции GTC 2026, прошедшей 11 марта, компания NVIDIA представила Nemotron 3 Super — открытую языковую модель нового поколения со 120 миллиардами параметров, из которых при инференсе активны лишь 12 миллиардов. Модель предназначена для сложных агентных сценариев и способна работать с контекстным окном в 1 миллион токенов, что позволяет агентам удерживать полное состояние рабочего процесса в памяти без потери цели.

Главное архитектурное нововведение — гибридная архитектура Mamba + Transformer в сочетании с механизмом Mixture-of-Experts. Слои Mamba обеспечивают четырёхкратную эффективность по памяти и вычислениям, а трансформерные слои отвечают за глубокое рассуждение. Технология LatentMoE позволяет активировать четырёх экспертов-специалистов по стоимости генерации одного токена, что делает модель исключительно эффективной при масштабировании.

Ещё два важных прорыва — обучение в формате NVFP4 с первого шага градиента (а не пост-квантизация, как у конкурентов) и встроенное предсказание нескольких токенов одновременно (Multi-Token Prediction), дающее трёхкратное ускорение инференса. На чипах NVIDIA Blackwell в режиме NVFP4 модель работает в четыре раза быстрее, чем в FP8 на предыдущем поколении Hopper, при этом без потери точности.

По результатам бенчмарков Nemotron 3 Super заняла первое место в рейтингах DeepResearch Bench и DeepResearch Bench II, опередив все открытые модели. На SWE-Bench Verified модель набрала 60,47% — лучший результат среди моделей с открытыми весами. Общая пропускная способность выше в пять раз по сравнению с предыдущей версией Nemotron Super и в 7,5 раз по сравнению с Qwen 3.5-122B.

Модель уже взята на вооружение ведущими технологическими компаниями. Среди AI-стартапов — Perplexity, CodeRabbit, Factory и Greptile. Из крупных корпораций — Palantir, Siemens, Dassault Systèmes и Cadence. Облачные провайдеры Google Cloud, Oracle Cloud и CoreWeave обеспечивают инфраструктуру для развёртывания. NVIDIA выпустила модель под открытой лицензией с полным рецептом обучения, что позволяет компаниям из регулируемых отраслей разворачивать её на собственных серверах.

Nemotron 3 Super знаменует важный сдвиг в индустрии: открытые модели по качеству догоняют проприетарные решения, при этом предлагая прозрачность и контроль. Гибридная архитектура Mamba + Transformer может задать новый стандарт для эффективных языковых моделей, сочетая линейную сложность по памяти с мощью механизма внимания. Для российских компаний, стремящихся к импортонезависимости в сфере ИИ, доступность открытых весов и полного рецепта обучения особенно ценна.

Попробуйте нейросети в MashaGPT

GPT-5, Claude, Gemini, генерация изображений и видео — всё в одном месте

Попробовать бесплатно

Источник:NVIDIA Blog

ПредыдущаяУчёные CMU создали процессор, который в 10 раз энергоэффективнее — и может сократить выбросы дата-центров на 100 млн тонн СледующаяШесть ключевых судебных решений по авторскому праву и ИИ: итоги 2025–2026 годов

NVIDIA представила Nemotron 3 Super — гибридную модель со 120 млрд параметров и революционной архитектурой LatentMoE

Читайте также

AI2 выпустила MolmoBot — робота, обученного целиком в симуляции

ИИ-учёные помогают людям решать климатические вопросы: прорывы 2026 года

YouTube расширяет ИИ-детекцию дипфейков на политиков и журналистов

MIT разработал метод выявления самоуверенных языковых моделей: ИИ теперь знает, когда он не прав

Amazon запустила Alexa+ в Великобритании: агентный ИИ-ассистент меняет онлайн-шопинг

ИИ-финансисты наступают: робо-эдвайзеры и AI-планировщики меняют управление личными финансами в 2026 году