GPT-5.4 — обзор флагмана OpenAI 2026
Автор: MashaGPT • 29 Апреля, 2026 • Нейросети
GPT-5.4 — флагманская модель OpenAI, выпущенная в феврале 2026 года. Это дробное, но весомое обновление линейки GPT-5: модель стала быстрее в 1,8 раза, дешевле на 20% по API, получила новый голосовой режим Voice Mode 2 с задержкой 0,3 секунды, расширила контекст до 400 000 токенов и научилась лучше работать с длинными агентскими цепочками. По данным OpenAI, ChatGPT с GPT-5.4 в чате уже к концу марта 2026 пользуются 1,1 миллиарда активных пользователей в неделю — это абсолютный рекорд для AI-сервисов в истории. В обзоре — все ключевые улучшения, бенчмарки, цена, лимиты в ChatGPT Plus и API, сравнение с Claude Opus 4.7 и Gemini 3.1 Pro, и как получить доступ из России без VPN.
Что нового в GPT-5.4
GPT-5.4 — это эволюция GPT-5, выпущенного в августе 2025. Внешне модель та же — тот же интерфейс ChatGPT, тот же API-эндпоинт, те же привычные сценарии. Под капотом — серьёзный апгрейд по пяти направлениям. Первое: Voice Mode 2 — голосовой режим с задержкой 0,3 секунды (против 1,2 секунды у GPT-5), поддержкой эмоций, шёпота, прерываний и пения. Второе: контекст вырос с 256 000 до 400 000 токенов — теперь модель «держит в голове» примерно 1 000 страниц A4 одновременно. Третье: Thinking Mode стал быстрее на 40% и дешевле, теперь его можно включать массово, а не только на сложных задачах. Четвёртое: добавлена нативная работа с видео до 60 секунд — модель смотрит ролик и описывает происходящее. Пятое: появились Computer Use Tools — модель может управлять браузером и компьютером для агентских задач (как в Anthropic Computer Use, но без необходимости отдельного API). Идентификатор в API: gpt-5.4 (и gpt-5.4-mini для быстрых задач).
Бенчмарки: GPT-5.4 vs GPT-5
Цифры со страницы релиза OpenAI: на MMLU-Pro (универсальные знания) GPT-5.4 набирает 89,3% против 84,7% у GPT-5 — рост на 5,4 пункта. На GPQA Diamond (научные вопросы PhD-уровня) — 81,7% против 75,2%. На MATH 2025 (олимпиадная математика) — 96,8% против 92,1%. На HumanEval (генерация кода на Python) — 94,1% против 90,5%. На SWE-bench Verified (правка реальных багов в open-source проектах) — 71,2% против 64,8%. На MMMU (мультимодальные задачи) — 78,9% против 71,3%, рост сильнее всего за счёт нового видео-понимания. На бенчмарке Arena (Elo-рейтинг по голосованиям пользователей) GPT-5.4 на момент публикации — 1437, второе место после Claude Opus 4.7 (1483) и впереди Gemini 3.1 Pro (1389). По задачам, где требуется голос, мультимодальность и веб-поиск, GPT-5.4 уверенно занимает первое место — Anthropic пока не закрыли голосовой сценарий, а Google в Gemini 3.1 голос реализовал слабее.

Бесплатно
Начать бесплатно →Все нейросети в одном месте — без VPN
ChatGPT, Claude, DeepSeek, Midjourney и 15+ моделей бесплатно
Voice Mode 2 — главное обновление
Голосовой режим — то, ради чего многие в 2026 переходят с Claude и Gemini обратно на ChatGPT. Voice Mode 2 работает с задержкой 0,3 секунды (это уровень обычного человеческого разговора по телефону), понимает эмоции в голосе собеседника, поддерживает шёпот и крик, может петь, читать стихи с правильной интонацией, переключаться между языками внутри одной фразы. Поддерживается 80+ языков — русский, английский, китайский, испанский, французский, немецкий, японский, корейский, татарский, армянский, грузинский, казахский и другие. Доступно 12 голосов на выбор: 6 мужских, 6 женских, плюс возможность создания собственного голоса по короткой записи (10 секунд) — пока только в США и для подписчиков Plus. На практике Voice Mode 2 заменяет: 1) репетитора иностранного языка (разговорная практика 24/7), 2) преподавателя по истории/географии/любому предмету (можно слушать лекцию с возможностью прервать вопросом), 3) психолога-собеседника, 4) собеседника для тренировки публичных выступлений, 5) гида в путешествии (через приложение на телефоне). Voice Mode 2 включён в подписку ChatGPT Plus за $20/мес без дополнительной платы.
Thinking Mode — стало дешевле и быстрее
Thinking Mode — режим «глубокого думания», когда модель сначала рассуждает «про себя» (внутренние шаги chain-of-thought), а потом выдаёт финальный ответ. В GPT-5 он был дорогим (в 5 раз дороже обычного режима) и медленным (ответ 30–60 секунд). В GPT-5.4 OpenAI оптимизировали внутреннюю архитектуру: теперь Thinking стоит всего в 2 раза дороже обычного режима и работает в 1,7 раза быстрее. На практике это означает, что Thinking можно включать на любом сложном вопросе — задаче по математике, разборе договора, отладке кода, стратегическом планировании — без боязни «съесть лимит» подписки. Уровни effort: low (быстрый ответ за 5–10 секунд), medium (15–25 секунд), high (40–60 секунд для самых сложных задач). По умолчанию ChatGPT Plus сам определяет, нужен ли Thinking — если вы спрашиваете «во сколько начнётся матч», модель ответит мгновенно без раздумий, если «реши систему уравнений» — включит Thinking автоматически. В API режим контролируется параметром reasoning_effort.
Контекст 400K токенов и работа с документами
Контекст GPT-5.4 — 400 000 токенов на входе и до 128 000 на выходе. В пересчёте на привычные единицы это около 300 000 слов или 1 000 страниц A4 — целая книга «Война и мир» помещается за раз. Для сравнения, GPT-5 был ограничен 256K токенов, GPT-4 Turbo — 128K, ChatGPT-3.5 — всего 16K. Что это даёт на практике: 1) можно загрузить весь годовой отчёт компании (200–500 страниц) и попросить найти риски — модель увидит контекст целиком; 2) можно дать модели 50 файлов из репозитория и спросить, как добавить новую функциональность — она проанализирует архитектуру; 3) можно загрузить 10 интервью с клиентами и попросить выделить общие паттерны жалоб; 4) можно задать диалог на 200 сообщений с историей — модель будет помнить детали с самого начала. Ограничение: Claude Opus 4.7 поддерживает 1 миллион токенов (в 2,5 раза больше) — для самых длинных документов всё ещё лучше брать Claude. Но для 95% сценариев 400K у GPT-5.4 более чем достаточно.
Мультимодальность: изображения, видео, аудио
GPT-5.4 — самая универсальная мультимодальная модель на рынке начала 2026. Изображения: модель «видит» фотографии, скриншоты, графики, чертежи, медицинские снимки, рукописные заметки. Может анализировать таблицы из PDF, читать рукописный текст, разбирать схемы. Связка с DALL-E 4 — генерация и редактирование картинок прямо из чата (например: «нарисуй кота в космосе» → «сделай его рыжим» → «добавь шлем» — без ухода в отдельный инструмент). Видео: новинка GPT-5.4 — модель смотрит ролики до 60 секунд и понимает происходящее (раньше это было только в Gemini). Применение: разбор рекламных роликов, анализ записей встреч, описание видео для слабовидящих. Sora 2 — интегрированная генерация видео из чата, длина до 30 секунд в HD. Аудио: распознавание речи, разделение спикеров, расшифровка интервью с диаризацией. Voice Mode 2 — отдельный режим разговора голосом. Документы: PDF, DOCX, XLSX, PPTX — все читаются нативно. Файлы изображений — JPG, PNG, WEBP, HEIC. Размер одного файла — до 50 МБ.
Computer Use Tools — управление компьютером
Главная агентская новинка GPT-5.4 — Computer Use Tools (CUT). Модель получает доступ к виртуальному браузеру в облаке и может выполнять задачи, которые раньше требовали ручной работы: бронировать билеты, заполнять формы, искать товары на маркетплейсах с фильтрами, оформлять заказы, скачивать файлы, отправлять формы обратной связи. Технически работает так: вы описываете задачу («забронируй мне рейс Москва-Стамбул на 15 мая в эконом-класс до 30 000 рублей»), модель открывает в облачном Chrome нужный сайт, видит экран как скриншоты, кликает мышкой, печатает текст, ориентируется в интерфейсе. По бенчмарку OSWorld (стандарт для агентов, управляющих компьютером) GPT-5.4 набирает 47,3% против 23,1% у GPT-5 — двукратный рост. Аналог у Anthropic — Computer Use в Claude — пока обгоняет GPT-5.4 на 5–8 пунктов, но в GPT-5.4 это работает прямо из ChatGPT Plus, без отдельной настройки API. Ограничения: пока CUT доступен только в ChatGPT Pro ($200/мес) и в режиме бета-тестирования; в Plus обещают добавить летом 2026.
Цена и лимиты
По API GPT-5.4 стоит $2,50 за миллион входных токенов и $10 за миллион выходных — это на 20% дешевле GPT-5 ($3 и $12 соответственно) и в 3 раза дешевле Claude Opus 4.7 ($7,50 и $37,50). GPT-5.4-mini — облегчённая версия для быстрых задач — $0,30 и $1,20, дешевле GPT-4o-mini в 2 раза. Подписки ChatGPT: Free — доступ к GPT-5.4 с лимитом 20 сообщений в 3 часа, без Voice Mode 2 и Thinking. Plus ($20/мес) — 200 сообщений GPT-5.4 в 3 часа, безлимит на GPT-5.4-mini, 60 минут Voice Mode 2 в день, неограниченный Thinking Low/Medium, 100 запросов Thinking High в неделю, доступ к Sora 2 и DALL-E 4. Pro ($200/мес) — безлимит почти на всё, ранний доступ к новым фич, Computer Use Tools. Team ($25/мес/пользователь от 2 человек) — то же что Plus + админ-панель + увеличенные лимиты + DPA. Enterprise (от $60/мес/пользователь) — корпоративные плюшки. В России официально оплатить нельзя — нужна зарубежная карта, либо через MashaGPT, где GPT-5.4 + Voice Mode + DALL-E + другие модели идут одним пакетом с оплатой в рублях.
GPT-5.4 vs Claude Opus 4.7 vs Gemini 3.1 Pro
Главные конкуренты в начале 2026: Claude Opus 4.7 от Anthropic (вышел в марте) и Gemini 3.1 Pro от Google (вышел в феврале). Кратко: GPT-5.4 — лучший в голосовых задачах (Voice Mode 2), мультимодальности, разговорном русском языке, веб-поиске, скорости, цене. Claude Opus 4.7 — лучший в коде (78,4% SWE-bench Verified против 71,2% у GPT-5.4), длинном контексте (1М токенов против 400К), точном следовании сложным инструкциям, безопасности. Gemini 3.1 Pro — лучший в работе с YouTube-видео (понимает ролики до 2 часов), интеграции с Google-сервисами (Docs, Sheets, Gmail), бесплатном тарифе (есть полноценный Free до 30 сообщений в день). По цене: GPT-5.4 ($2,5/$10) — средний сегмент, Gemini 3.1 Pro ($1,25/$10) — самый дешёвый из топ-моделей, Claude Opus 4.7 ($7,50/$37,50) — самый дорогой. Для большинства бизнес-задач: GPT-5.4 как основной (90% работы), Claude Opus 4.7 для длинных документов и кода, Gemini для бесплатных запросов и интеграций с Google. В MashaGPT доступны все три модели в одной подписке — можно сравнить ответы и выбрать лучший.
Кому подойдёт GPT-5.4
Маркетологам, копирайтерам, контент-мейкерам — за счёт Voice Mode 2 и мультимодальности. Можно надиктовать 10-минутное голосовое ТЗ — модель распишет план статьи, нарисует визуал через DALL-E, проверит факты в интернете. Преподавателям и репетиторам — Voice Mode 2 как инструмент разговорной практики иностранного языка, мультимодальность для разбора рукописных задач студентов. Менеджерам по продажам — голосовой ассистент в дороге, разбор записей переговоров, генерация follow-up писем. Малому бизнесу — Computer Use Tools для автоматизации рутины (бронирование, оформление документов, мониторинг цен конкурентов). Студентам — Thinking Mode стал дешёвым, можно решать любые домашние задачи без боязни лимитов. Журналистам — длинный контекст (можно загрузить 100-страничный отчёт) + веб-поиск + распознавание речи в одном инструменте. Не подойдёт: профессиональным разработчикам больших проектов (Claude Opus 4.7 надёжнее для production-кода) и юристам, работающим с гигантскими договорами (Claude вмещает в 2,5 раза больше).
Как получить доступ из России
OpenAI официально блокирует российские IP, не принимает российские карты, не открывает аккаунты с указанием России. Прямой доступ в ChatGPT и API невозможен. Варианты: 1) VPN с европейским/американским IP + зарубежная виртуальная карта (Wise, Revolut, Capitalist) — рискованно, аккаунты блокируются за нарушение Terms of Service, оплаты замораживаются. 2) Корпоративный доступ через Microsoft Azure OpenAI Service — для юрлиц с зарубежной структурой, требует подачи заявки и подтверждения от Microsoft. 3) Российские агрегаторы — наиболее практичный путь для частных пользователей и малого бизнеса. MashaGPT даёт доступ к GPT-5.4 (включая Voice Mode 2 на iOS/Android), DALL-E 4, Sora 2, Claude Opus 4.7, Gemini 3.1 Pro, YandexGPT 5 Pro и GigaChat в одной подписке. Оплата в рублях через СБП, без VPN, поддержка на русском языке. Базовый тариф — около 990 ₽/мес, командный (3+ пользователей) — от 2 500 ₽/мес. Для юрлиц — DPA, закрывающие документы, оплата по счёту.
Итог: стоит ли переходить на GPT-5.4
GPT-5.4 — самое значительное обновление линейки GPT за последний год. Voice Mode 2 — единственный голосовой ассистент на рынке, реально работающий на уровне человеческого разговора. Расширение контекста до 400K, удешевление Thinking Mode, добавление видео и Computer Use Tools — всё это превращает ChatGPT из просто чат-бота в универсального AI-помощника. Цена снизилась на 20%, скорость выросла в 1,8 раза. Для большинства задач (маркетинг, контент, обучение, продажи, малый бизнес) GPT-5.4 — оптимальный выбор по соотношению цены и возможностей. Слабые места — производственный код (там Claude Opus 4.7 надёжнее) и сверхдлинные документы (там Claude вмещает больше). Если уже пользуетесь ChatGPT Plus — обновление произошло автоматически в феврале, ничего делать не нужно. Если ещё не пробовали — попробуйте GPT-5.4 через MashaGPT с оплатой в рублях, без VPN, с доступом ко всем фичам включая Voice Mode 2 и DALL-E 4.
Погрузись в мир ИИ
28 Апреля, 2026
28 Апреля, 2026
28 Апреля, 2026
27 Апреля, 2026



