нейросети22 марта 2026 г.

Стоимость ИИ-инференса упала в 1000 раз за три года: наступила эра дешёвого интеллекта

Стоимость запуска моделей уровня GPT-4 рухнула с $20 до $0,02 за миллион токенов. Jensen Huang объявил о наступлении «точки перелома инференса», а рабочие нагрузки вывода займут две трети всех вычислений в 2026 году.

Стоимость ИИ-инференса упала в 1000 раз за три года: наступила эра дешёвого интеллекта

Индустрия искусственного интеллекта достигла исторического рубежа: стоимость инференса — процесса запуска обученных моделей для генерации ответов — упала более чем в тысячу раз за три года. Если в конце 2022 года запуск модели уровня GPT-4 стоил около $20 за миллион токенов, то в начале 2026-го эквивалентная производительность обходится всего в $0,02. Это одно из самых стремительных падений стоимости в истории вычислительной техники.

Глава NVIDIA Дженсен Хуанг на конференции GTC 2026 провозгласил наступление «точки перелома инференса». По его словам, компания «заново изобрела вычисления» и стоит у начала новой платформенной смены. Рабочие нагрузки инференса составят примерно две трети всех вычислений в 2026 году — по сравнению с третью в 2023-м, а рынок чипов, оптимизированных для инференса, вырастет до $50 млрд.

Ключевой фактор удешевления — переход от спорадических задач обучения к непрерывной работе автономных агентов. Предприятия всё активнее интегрируют ИИ-агентов в операционные процессы, создавая постоянный спрос на токены и низкую задержку ответов в режиме 24/7, в отличие от разовых тренировочных запусков.

Новая платформа NVIDIA Rubin обещает десятикратное снижение стоимости токена и десятикратный рост производительности по сравнению с Blackwell. Платформа объединяет шесть новых чипов в единый ИИ-суперкомпьютер. Продукты на базе Rubin будут доступны от облачных партнёров — AWS, Google Cloud, Microsoft и OCI — во второй половине 2026 года.

Выручка NVIDIA выросла с $27 млрд в 2022 году до $216 млрд в 2025-м, а текущая рыночная капитализация достигла $4,5 трлн. Аналитик Wedbush Securities Дэн Айвз уверен, что NVIDIA не уступит рыночную долю ни одному конкуренту. Объём заказов на чипы Blackwell, по прогнозам, превысит $1 трлн к концу 2026 года.

Как образно выразился глава подразделения устойчивого развития NVIDIA Джош Паркер: «Если бы топливная эффективность автомобилей росла так же быстро, как эффективность чипов, мы бы ездили на Луну и обратно на одном галлоне бензина». Энергоэффективность становится центральным ограничением — именно она определяет потолок объёма интеллекта, который может быть произведён.

Попробуйте нейросети в MashaGPT

GPT-5, Claude, Gemini, генерация изображений и видео — всё в одном месте

Попробовать бесплатно
Источник:PJ Media