OpenAI снизила цены на GPT-4 Turbo
Автор: MashaGPT • 7 Ноября, 2023 • НейросетиТеперь пользователям доступны GPT-4 Turbo с контекстом 128 тысяч токенов и более низкими ценами, а для разработчиков открыта новая платформа API Assistants. А еще появились мультимодальные возможности, включая машинное зрение, создание изображений в DALL-E 3 и преобразование текста в речь (TTS). Узнали, что предлагает компания.
GPT-4 Turbo с расширенным контекстом
OpenAI выпустила первую версию GPT-4 в марте, а в июле сделала GPT-4 общедоступной для всех разработчиков. 6 ноября в компании представили предварительный просмотр следующего поколения этой модели – GPT-4 Turbo. GPT-4 Turbo более функциональна и обладает знаниями о мировых событиях до апреля 2023 года. Она имеет контекстное окно размером 128 тысяч токенов, поэтому в одном промте может разместиться эквивалент более 300 страниц текста. Также была оптимизировала ее производительность, поэтому в компании снизили цены в 3 раза для входных токенов и в 2 раза для выходных токенов по сравнению с GPT-4. GPT-4 Turbo доступна всем платным разработчикам по API. В ближайшие недели планируется выпустить стабильную, готовую к производству модель.
Обновлена GPT-3.5 Turbo
В дополнение к GPT-4 Turbo компания также выпускает новую версию GPT-3.5 Turbo, которая по умолчанию поддерживает контекстное окно в 16 тысяч токенов. Новый 3.5 Turbo поддерживает улучшенное следование инструкциям, режим JSON и параллельный вызов функций. Например, внутренние оценки показывают улучшение формата на 38 % при выполнении таких задач, как генерация JSON, XML и YAML. Приложения, использующие имя gpt-3.5-turbo, будут автоматически обновлены до новой модели 11 декабря. Доступ к более старым моделям будет по-прежнему возможен после передачи gpt-3.5-turbo-0613 в API до 13 июня 2024 г.
API-интерфейс Assistants, поиск и интерпретатор кода
Запущена платформа API Assistants – специально созданный искусственный интеллект, который имеет конкретные инструкции, использует дополнительные знания и может вызывать модели и инструменты для выполнения задач. Она предоставляет новые возможности, такие как интерпретатор и извлечение кода, а также вызов функций. Это позволяет выполнять большую часть рутинной работы и создавать высококачественные приложения искусственного интеллекта. Этот API разработан с учетом гибкости. Способы использования варьируются от приложения для анализа данных на естественном языке, помощника по программированию, планировщика отпуска на базе искусственного интеллекта, диджея с голосовым управлением, интеллектуального визуального холста и т.д. Ключевым изменением, представленным в этом API, являются постоянные и бесконечно длинные потоки, которые позволяют разработчикам передавать управление состоянием потоков OpenAI и обходить ограничения контекстных окон. С помощью API Assistants можно добавлять каждое новое сообщение в существующую цепочку. Как и в случае с остальной платформой, данные и файлы, передаваемые в API OpenAI, никогда не используются для обучения наших моделей, и разработчики могут удалить данные, когда сочтут нужным. Бета-версию Assistants API без написания кода можно попробовать на платформе Assistants Playground. Это веб-платформа, которая позволяет разработчикам взаимодействовать с различными языковыми моделями. Доступ к Playground открывается в рамках доступа к OpenAI API.
Новые возможности в API
GPT-4 Turbo с распознаванием изображений
GPT-4 Turbo может принимать изображения в качестве входных данных в API Chat Completions, что позволяет использовать такие варианты, как создание подписей, подробный анализ изображений реального мира и чтение документов с рисунками. Например, BeMyEyes использует эту технологию, чтобы помочь слепым или слабовидящим людям выполнять повседневные задачи, такие как определение продукта или навигация по магазину.
DALL-E 3
Разработчики могут интегрировать DALL-E 3, который недавно был запущен для пользователей ChatGPT Plus и Enterprise, непосредственно в свои приложения и продукты через API изображений, указав DALL-E 3 в качестве модели. Такие компании, как Snap, Coca-Cola и Shutterstock, использовали DALL-E 3 для программного создания изображений и дизайна для своих клиентов и кампаний. Как и в предыдущей версии DALL-E, API включает встроенную модерацию, помогающую разработчикам защитить свои приложения от неправильного использования.
Преобразование текста в речь (TTS)
Теперь разработчики могут генерировать речь человеческого качества из текста с помощью API преобразования текста в речь. Новая модель TTS предлагает на выбор шесть предустановленных голосов и два варианта модели: tts-1 и tts-1-hd. tts оптимизирован для случаев использования в реальном времени, а tts-1-hd оптимизирован по качеству.
Доступ к тонкой настройке GPT-4
Компания OpenAI также создала экспериментальную программу доступа для тонкой настройки (fine tuning) GPT-4. Предварительные результаты показывают, что тонкая настройка GPT-4 требует больше работы для достижения значимых улучшений по сравнению с базовой моделью со значительными преимуществами, полученными при тонкой настройке GPT-3.5.
Новые тарифы
Стоимость за пользование GPT-4 Turbo снизилась в три раза – всего $0.01 за 1000 входных и $0.03 за 1000 выходных токенов. Входные токены для GPT-3.5 Turbo также стали дешевле в 3 раза – 0,001 доллара США, а выходные токены в 2 раза дешевле – 0,002 доллара США.
Погрузись в мир ИИ
MashaGPT - интерфейс для работы с ChatGPT для пользователей из России.