Израильско-немецкая компания D-ID представила V4 Expressive Visual Agents — четвёртое поколение технологии цифровых аватаров, способных вести диалог с человеком в реальном времени. Новая модель основана на диффузионной архитектуре, обученной на выступлениях реальных актёров, и обеспечивает беспрецедентную реалистичность мимики и жестов. Разрешение достигает 4K, а задержка в разговоре составляет менее 0,5 секунды.
Главное отличие V4 от предыдущих поколений — динамическое согласование эмоций. Аватар распознаёт настроение собеседника через опциональную камеру и адаптирует выражение лица в ответ. Система поддерживает длительные сессии: тренинговые модули, многоязычные видеопрезентации и интерактивные объяснения без потери идентичности аватара на протяжении часов.
V4 напрямую подключается к большим языковым моделям, что позволяет аватарам не просто озвучивать текст, а вести полноценный интеллектуальный диалог. В интерфейс встроены интерактивные элементы: формы, опросники и графики, которые аватар может показывать во время общения. Это открывает возможности для использования в корпоративном обучении, техподдержке и продажах.
Ценовая политика стала одним из главных козырей анонса: стоимость начинается от $5,90 в месяц, что в 70 раз дешевле Google VEO 3 Fast. Такая агрессивная цена делает технологию доступной не только крупным корпорациям, но и малому бизнесу, образовательным учреждениям и индивидуальным создателям контента.
«Сегодня, с выходом V4, мы устанавливаем новый стандарт точности и производительности аватаров, сохраняя скорость, достаточную для разговоров в реальном времени», — заявил генеральный директор D-ID Гил Перри. Компания уже обслуживает 1 500 корпоративных клиентов и миллионы подписчиков в более чем 70 странах мира.
На платформе D-ID было создано более 800 000 интерактивных визуальных агентов и свыше 300 миллионов неинтерактивных аватаров. После приобретения компании simpleshow в сентябре 2025 года годовая выручка D-ID выросла на 250%. V4 позиционируется как технология, которая превратит цифровых аватаров из нишевого инструмента в массовый интерфейс взаимодействия с ИИ.






