GPT-5.4 — обзор флагмана OpenAI 2026
Автор: MashaGPT • 29 Апреля, 2026 • Нейросети
GPT-5.4 — флагманская модель OpenAI, выпущенная в феврале 2026 года. Это дробное, но весомое обновление линейки GPT-5: модель стала быстрее в 1,8 раза, дешевле на 20% по API, получила новый голосовой режим Voice Mode 2 с задержкой 0,3 секунды, расширила контекст до 400 000 токенов и научилась лучше работать с длинными агентскими цепочками. По данным OpenAI, ChatGPT с GPT-5.4 в чате уже к концу марта 2026 пользуются 1,1 миллиарда активных пользователей в неделю — это абсолютный рекорд для AI-сервисов в истории. В обзоре — все ключевые улучшения, бенчмарки, цена, лимиты в ChatGPT Plus и API, сравнение с Claude Opus 4.7 и Gemini 3.1 Pro, и как получить доступ из России без VPN.
Что нового в GPT-5.4
GPT-5.4 — это эволюция GPT-5, выпущенного в августе 2025.
- Внешне модель та же — тот же интерфейс ChatGPT, тот же API-эндпоинт, те же привычные сценарии.
- Под капотом — серьёзный апгрейд по пяти направлениям.
- Первое: Voice Mode 2 — голосовой режим с задержкой 0,3 секунды (против 1,2 секунды у GPT-5), поддержкой эмоций, шёпота, прерываний и пения.
- Второе: контекст вырос с 256 000 до 400 000 токенов — теперь модель «держит в голове» примерно 1 000 страниц A4 одновременно.
Третье: Thinking Mode стал быстрее на 40% и дешевле, теперь его можно включать массово, а не только на сложных задачах. Четвёртое: добавлена нативная работа с видео до 60 секунд — модель смотрит ролик и описывает происходящее. Пятое: появились Computer Use Tools — модель может управлять браузером и компьютером для агентских задач (как в Anthropic Computer Use, но без необходимости отдельного API). Идентификатор в API: gpt-5.4 (и gpt-5.4-mini для быстрых задач).
Бенчмарки: GPT-5.4 vs GPT-5
Цифры со страницы релиза OpenAI: на MMLU-Pro (универсальные знания) GPT-5.4 набирает 89,3% против 84,7% у GPT-5 — рост на 5,4 пункта.
- На GPQA Diamond (научные вопросы PhD-уровня) — 81,7% против 75,2%.
- На MATH 2025 (олимпиадная математика) — 96,8% против 92,1%.
- На HumanEval (генерация кода на Python) — 94,1% против 90,5%.
- На SWE-bench Verified (правка реальных багов в open-source проектах) — 71,2% против 64,8%.
- На MMMU (мультимодальные задачи) — 78,9% против 71,3%, рост сильнее всего за счёт нового видео-понимания.
На бенчмарке Arena (Elo-рейтинг по голосованиям пользователей) GPT-5.4 на момент публикации — 1437, второе место после Claude Opus 4.7 (1483) и впереди Gemini 3.1 Pro (1389). По задачам, где требуется голос, мультимодальность и веб-поиск, GPT-5.4 уверенно занимает первое место — Anthropic пока не закрыли голосовой сценарий, а Google в Gemini 3.1 голос реализовал слабее.

ChatGPT, Claude, DeepSeek, Midjourney и 15+ моделей бесплатно
Voice Mode 2 — главное обновление
Голосовой режим — то, ради чего многие в 2026 переходят с Claude и Gemini обратно на ChatGPT. Voice Mode 2 работает с задержкой 0,3 секунды (это уровень обычного человеческого разговора по телефону), понимает эмоции в голосе собеседника, поддерживает шёпот и крик, может петь, читать стихи с правильной интонацией, переключаться между языками внутри одной фразы. Поддерживается 80+ языков — русский, английский, китайский, испанский, французский, немецкий, японский, корейский, татарский, армянский, грузинский, казахский и другие. Доступно 12 голосов на выбор: 6 мужских, 6 женских, плюс возможность создания собственного голоса по короткой записи (10 секунд) — пока только в США и для подписчиков Plus. На практике Voice Mode 2 заменяет:
- репетитора иностранного языка (разговорная практика 24/7),
- преподавателя по истории/географии/любому предмету (можно слушать лекцию с возможностью прервать вопросом),
- психолога-собеседника,
- собеседника для тренировки публичных выступлений,
- гида в путешествии (через приложение на телефоне). Voice Mode 2 включён в подписку ChatGPT Plus за $20/мес без дополнительной платы.
Thinking Mode — стало дешевле и быстрее
Thinking Mode — режим «глубокого думания», когда модель сначала рассуждает «про себя» (внутренние шаги chain-of-thought), а потом выдаёт финальный ответ. В GPT-5 он был дорогим (в 5 раз дороже обычного режима) и медленным (ответ 30–60 секунд). В GPT-5.4 OpenAI оптимизировали внутреннюю архитектуру: теперь Thinking стоит всего в 2 раза дороже обычного режима и работает в 1,7 раза быстрее. На практике это означает, что Thinking можно включать на любом сложном вопросе — задаче по математике, разборе договора, отладке кода, стратегическом планировании — без боязни «съесть лимит» подписки. Уровни effort: low (быстрый ответ за 5–10 секунд), medium (15–25 секунд), high (40–60 секунд для самых сложных задач). По умолчанию ChatGPT Plus сам определяет, нужен ли Thinking — если вы спрашиваете «во сколько начнётся матч», модель ответит мгновенно без раздумий, если «реши систему уравнений» — включит Thinking автоматически. В API режим контролируется параметром reasoning_effort.
Контекст 400K токенов и работа с документами
Контекст GPT-5.4 — 400 000 токенов на входе и до 128 000 на выходе. В пересчёте на привычные единицы это около 300 000 слов или 1 000 страниц A4 — целая книга «Война и мир» помещается за раз. Для сравнения, GPT-5 был ограничен 256K токенов, GPT-4 Turbo — 128K, ChatGPT-3.5 — всего 16K. Что это даёт на практике:
- можно загрузить весь годовой отчёт компании (200–500 страниц) и попросить найти риски — модель увидит контекст целиком;
- можно дать модели 50 файлов из репозитория и спросить, как добавить новую функциональность — она проанализирует архитектуру;
- можно загрузить 10 интервью с клиентами и попросить выделить общие паттерны жалоб;
- можно задать диалог на 200 сообщений с историей — модель будет помнить детали с самого начала. Ограничение: Claude Opus 4.7 поддерживает 1 миллион токенов (в 2,5 раза больше) — для самых длинных документов всё ещё лучше брать Claude. Но для 95% сценариев 400K у GPT-5.4 более чем достаточно.
Мультимодальность: изображения, видео, аудио
GPT-5.4 — самая универсальная мультимодальная модель на рынке начала 2026.
- Изображения: модель «видит» фотографии, скриншоты, графики, чертежи, медицинские снимки, рукописные заметки. Может анализировать таблицы из PDF, читать рукописный текст, разбирать схемы.
- Связка с DALL-E 4 — генерация и редактирование картинок прямо из чата (например: «нарисуй кота в космосе» → «сделай его рыжим» → «добавь шлем» — без ухода в отдельный инструмент). Видео: новинка GPT-5.4 — модель смотрит ролики до 60 секунд и понимает происходящее (раньше это было только в Gemini).
- Применение: разбор рекламных роликов, анализ записей встреч, описание видео для слабовидящих. Sora 2 — интегрированная генерация видео из чата, длина до 30 секунд в HD. Аудио: распознавание речи, разделение спикеров, расшифровка интервью с диаризацией. Voice Mode 2 — отдельный режим разговора голосом.
- Документы: PDF, DOCX, XLSX, PPTX — все читаются нативно. Файлы изображений — JPG, PNG, WEBP, HEIC. Размер одного файла — до 50 МБ.
Computer Use Tools — управление компьютером
Главная агентская новинка GPT-5.4 — Computer Use Tools (CUT).
- Модель получает доступ к виртуальному браузеру в облаке и может выполнять задачи, которые раньше требовали ручной работы: бронировать билеты, заполнять формы, искать товары на маркетплейсах с фильтрами, оформлять заказы, скачивать файлы, отправлять формы обратной связи.
- Технически работает так: вы описываете задачу («забронируй мне рейс Москва-Стамбул на 15 мая в эконом-класс до 30 000 рублей»), модель открывает в облачном Chrome нужный сайт, видит экран как скриншоты, кликает мышкой, печатает текст, ориентируется в интерфейсе. По бенчмарку OSWorld (стандарт для агентов, управляющих компьютером) GPT-5.4 набирает 47,3% против 23,1% у GPT-5 — двукратный рост. Аналог у Anthropic — Computer Use в Claude — пока обгоняет GPT-5.4 на 5–8 пунктов, но в GPT-5.4 это работает прямо из ChatGPT Plus, без отдельной настройки API.
- Ограничения: пока CUT доступен только в ChatGPT Pro ($200/мес) и в режиме бета-тестирования; в Plus обещают добавить летом 2026.
Цена и лимиты
По API GPT-5.4 стоит $2,50 за миллион входных токенов и $10 за миллион выходных — это на 20% дешевле GPT-5 ($3 и $12 соответственно) и в 3 раза дешевле Claude Opus 4.7 ($7,50 и $37,50). GPT-5.4-mini — облегчённая версия для быстрых задач — $0,30 и $1,20, дешевле GPT-4o-mini в 2 раза.
- Подписки ChatGPT: Free — доступ к GPT-5.4 с лимитом 20 сообщений в 3 часа, без Voice Mode 2 и Thinking.
- Plus ($20/мес) — 200 сообщений GPT-5.4 в 3 часа, безлимит на GPT-5.4-mini, 60 минут Voice Mode 2 в день, неограниченный Thinking Low/Medium, 100 запросов Thinking High в неделю, доступ к Sora 2 и DALL-E 4.
- Pro ($200/мес) — безлимит почти на всё, ранний доступ к новым фич, Computer Use Tools.
- Team ($25/мес/пользователь от 2 человек) — то же что Plus + админ-панель + увеличенные лимиты + DPA.
- Enterprise (от $60/мес/пользователь) — корпоративные плюшки.
- В России официально оплатить нельзя — нужна зарубежная карта, либо через MashaGPT, где GPT-5.4 + Voice Mode + DALL-E + другие модели идут одним пакетом с оплатой в рублях.
GPT-5.4 vs Claude Opus 4.7 vs Gemini 3.1 Pro
Главные конкуренты в начале 2026: Claude Opus 4.7 от Anthropic (вышел в марте) и Gemini 3.1 Pro от Google (вышел в феврале). Кратко: GPT-5.4 — лучший в голосовых задачах (Voice Mode 2), мультимодальности, разговорном русском языке, веб-поиске, скорости, цене. Claude Opus 4.7 — лучший в коде (78,4% SWE-bench Verified против 71,2% у GPT-5.4), длинном контексте (1М токенов против 400К), точном следовании сложным инструкциям, безопасности. Gemini 3.1 Pro — лучший в работе с YouTube-видео (понимает ролики до 2 часов), интеграции с Google-сервисами (Docs, Sheets, Gmail), бесплатном тарифе (есть полноценный Free до 30 сообщений в день).
По цене: GPT-5.4 ($2,5/$10) — средний сегмент, Gemini 3.1 Pro ($1,25/$10) — самый дешёвый из топ-моделей, Claude Opus 4.7 ($7,50/$37,50) — самый дорогой. Для большинства бизнес-задач: GPT-5.4 как основной (90% работы), Claude Opus 4.7 для длинных документов и кода, Gemini для бесплатных запросов и интеграций с Google. В MashaGPT доступны все три модели в одной подписке — можно сравнить ответы и выбрать лучший.
Кому подойдёт GPT-5.4
- Маркетологам, копирайтерам, контент-мейкерам — за счёт Voice Mode 2 и мультимодальности.
- Можно надиктовать 10-минутное голосовое ТЗ — модель распишет план статьи, нарисует визуал через DALL-E, проверит факты в интернете.
- Преподавателям и репетиторам — Voice Mode 2 как инструмент разговорной практики иностранного языка, мультимодальность для разбора рукописных задач студентов.
- Менеджерам по продажам — голосовой ассистент в дороге, разбор записей переговоров, генерация follow-up писем.
- Малому бизнесу — Computer Use Tools для автоматизации рутины (бронирование, оформление документов, мониторинг цен конкурентов).
- Студентам — Thinking Mode стал дешёвым, можно решать любые домашние задачи без боязни лимитов.
- Журналистам — длинный контекст (можно загрузить 100-страничный отчёт) + веб-поиск + распознавание речи в одном инструменте.
Не подойдёт: профессиональным разработчикам больших проектов (Claude Opus 4.7 надёжнее для production-кода) и юристам, работающим с гигантскими договорами (Claude вмещает в 2,5 раза больше).
Как получить доступ из России
OpenAI официально блокирует российские IP, не принимает российские карты, не открывает аккаунты с указанием России. Прямой доступ в ChatGPT и API невозможен. Варианты:
- VPN с европейским/американским IP + зарубежная виртуальная карта (Wise, Revolut, Capitalist) — рискованно, аккаунты блокируются за нарушение Terms of Service, оплаты замораживаются.
- Корпоративный доступ через Microsoft Azure OpenAI Service — для юрлиц с зарубежной структурой, требует подачи заявки и подтверждения от Microsoft.
- Российские агрегаторы — наиболее практичный путь для частных пользователей и малого бизнеса. MashaGPT даёт доступ к GPT-5.4 (включая Voice Mode 2 на iOS/Android), DALL-E 4, Sora 2, Claude Opus 4.7, Gemini 3.1 Pro в одной подписке. Оплата в рублях через СБП, без VPN, поддержка на русском языке. Базовый тариф — около 990 ₽/мес, командный (3+ пользователей) — от 2 500 ₽/мес. Для юрлиц — DPA, закрывающие документы, оплата по счёту.
Итог: стоит ли переходить на GPT-5.4
GPT-5.4 — самое значительное обновление линейки GPT за последний год. Voice Mode 2 — единственный голосовой ассистент на рынке, реально работающий на уровне человеческого разговора. Расширение контекста до 400K, удешевление Thinking Mode, добавление видео и Computer Use Tools — всё это превращает ChatGPT из просто чат-бота в универсального AI-помощника. Цена снизилась на 20%, скорость выросла в 1,8 раза. Для большинства задач (маркетинг, контент, обучение, продажи, малый бизнес) GPT-5.4 — оптимальный выбор по соотношению цены и возможностей. Слабые места — производственный код (там Claude Opus 4.7 надёжнее) и сверхдлинные документы (там Claude вмещает больше). Если уже пользуетесь ChatGPT Plus — обновление произошло автоматически в феврале, ничего делать не нужно. Если ещё не пробовали — попробуйте GPT-5.4 через MashaGPT с оплатой в рублях, без VPN, с доступом ко всем фичам включая Voice Mode 2 и DALL-E 4.



