Рынок AI-чипов в 2026 году переживает тектонический сдвиг. Если ещё два года назад NVIDIA контролировала около 90% выручки от серверных GPU, то сейчас эта доля снизилась до 86%. Причина — агрессивное наступление конкурентов сразу на нескольких фронтах: AMD наращивает долю в инференсе, Intel ищет новых партнёров, а крупнейшие технологические компании создают собственные чипы.
Главной угрозой для NVIDIA стала AMD. Её ускоритель MI355X уже показывает на 30% более быстрый инференс по сравнению с NVIDIA B200 на модели Llama 3.1 405B, а стоимость за токен оказывается на 40% ниже. Но настоящий прорыв ожидается с выходом MI450 во второй половине 2026 года — эти чипы станут основой масштабного контракта с OpenAI на 6 гигаватт вычислительных мощностей стоимостью в десятки миллиардов долларов. Аналогичную сделку AMD заключила и с Meta.
Intel, потерявший позиции со своими чипами Gaudi, избрал другую стратегию. После того как сделка по приобретению стартапа SambaNova за 1,6 миллиарда долларов сорвалась, компания в феврале 2026 года заключила многолетнее партнёрство с этим разработчиком AI-чипов. SambaNova привнесёт свою архитектуру dataflow для корпоративного ИИ, а Intel обеспечит производственные мощности и серверную платформу.
Meta в марте представила сразу четыре собственных чипа — MTIA 300, 400, 450 и 500. Тенденция к созданию заказных AI-процессоров набирает обороты: по прогнозам, поставки ASIC-чипов для облачных провайдеров вырастут на 44,6% в 2026 году, тогда как рост поставок GPU составит лишь 16,1%. Google с TPU, Amazon с Trainium и теперь Meta с MTIA — все стремятся снизить зависимость от NVIDIA.
Ключевым полем битвы становится инференс — процесс запуска уже обученных моделей, который питает чат-ботов, генерацию кода и другие AI-сервисы. Именно здесь альтернативные архитектуры показывают наибольшее преимущество. Чипы на базе SRAM, как у Groq (теперь в составе NVIDIA после сделки за 20 миллиардов долларов) и Cerebras, достигают скорости в 500–1000 токенов в секунду — в разы больше, чем традиционные GPU.
Тем не менее экосистема CUDA остаётся мощнейшим конкурентным преимуществом NVIDIA: двадцать лет разработки, миллионы обученных разработчиков и тысячи оптимизированных библиотек. AMD постепенно догоняет с ROCm и поддержкой PyTorch, а проект ZLUDA позволяет запускать CUDA-код на AMD без модификаций. Но пока выбор для большинства команд однозначен: NVIDIA для обучения крупных моделей, AMD и альтернативы — для инференса, где решает цена за токен.






