17 марта 2026 года стал знаковым днём для рынка больших языковых моделей: сразу две крупные компании — OpenAI и Mistral AI — анонсировали выпуск компактных, но мощных моделей нового поколения. OpenAI представила GPT-5.4 mini и GPT-5.4 nano, а французский стартап Mistral AI выпустил Mistral Small 4 с открытой лицензией Apache 2.0. Оба релиза объединяет общая идея: максимальная производительность при минимальных вычислительных затратах.
GPT-5.4 mini показывает результаты в пределах 5% от флагманской GPT-5.4 на бенчмарках SWE-Bench Pro и OS-World-Verified, при этом выполняет ряд задач более чем вдвое быстрее предшественника GPT-5 mini. Модель поддерживает контекстное окно в 400 000 токенов, принимает текст и изображения, и уже доступна в ChatGPT, Codex и через API. Стоимость составляет $0,75 за миллион входных токенов и $4,50 за миллион выходных — значительно дешевле полноразмерной версии.
GPT-5.4 nano — самая маленькая и дешёвая модель в линейке GPT-5.4, предназначенная для задач, где критичны скорость и стоимость: извлечение данных, классификация, ранжирование и простое программирование. Цена — всего $0,20 за миллион входных токенов. Как отметил заместитель технического директора Perplexity AI Джерри Ма: «Mini обеспечивает сильное рассуждение, а nano — отзывчивый и эффективный инструмент для живых диалоговых сценариев».
Mistral Small 4, в свою очередь, использует архитектуру Mixture of Experts (MoE) со 119 миллиардами параметров, распределёнными между 128 экспертными подсетями. При обработке запроса активируются лишь 4 эксперта с суммарным объёмом в 6 млрд параметров, что обеспечивает 40-процентное сокращение задержки при генерации ответов. Модель поддерживает мультимодальный ввод и настраиваемый уровень «усилия рассуждения» (reasoning_effort).
Эти релизы отражают ключевой тренд 2026 года: гонка за эффективность вместо гонки за размер. Компании осознали, что большинству коммерческих задач не нужны триллионные модели — достаточно компактных, быстрых и дешёвых решений. GPT-5.4 mini уже интегрирована в GitHub Copilot, а Mistral Small 4 доступна с открытой лицензией, что позволяет запускать её на собственной инфраструктуре с минимумом из четырёх GPU Nvidia HGX H100.
Для российского рынка это означает расширение доступа к мощным ИИ-инструментам при существенно меньших затратах на инфраструктуру. Открытая лицензия Mistral Small 4 особенно важна для компаний, которым необходимо развёртывание моделей на локальных серверах без зависимости от облачных API. Конкуренция между OpenAI и Mistral AI в сегменте компактных моделей обещает дальнейшее снижение цен и повышение качества генерации в ближайшие месяцы.






