Google DeepMind представила Gemini Robotics-ER 1.6 — обновлённую модель для воплощённого рассуждения (embodied reasoning), которая позволяет роботам понимать окружающую среду и автономно планировать физические задачи. Модель выступает в роли «высокоуровневого мыслительного слоя», давая роботам возможность самостоятельно анализировать сложные сцены, вызывать внешние инструменты — от Google Search до моделей «зрение-язык-действие» — и принимать решения без участия оператора.
Ключевое улучшение версии 1.6 — усиленное пространственное рассуждение и понимание нескольких камер одновременно. Модель стабильно превосходит как предшественницу ER 1.5, так и Gemini 3.0 Flash в задачах указания на объекты, подсчёта предметов и определения успешного завершения задачи. Особенно впечатляет точность чтения приборов: при использовании агентной обработки изображений модель достигает 93% успешных считываний показаний манометров и уровнемеров.
Главный партнёр по внедрению — Boston Dynamics. Робот Spot с интегрированной моделью ER 1.6 способен автономно инспектировать промышленные объекты: считывать показания сложных приборов, обнаруживать разливы и мусор, анализировать состояние оборудования. Марко да Силва, вице-президент Boston Dynamics по направлению Spot, отметил: «Модель позволяет роботам видеть, понимать и реагировать на реальные проблемы полностью автономно». Интеграция уже доступна всем клиентам Boston Dynamics через платформу Orbit и систему AI Visual Inspection.
Безопасность стала ещё одним фокусом обновления. Gemini Robotics-ER 1.6 демонстрирует улучшение на 6% по сравнению с Gemini 3.0 Flash в идентификации текстовых угроз безопасности и на 10% — в видеосценариях. Модель лучше соблюдает ограничения физической безопасности, что критически важно для промышленных роботов, работающих рядом с людьми и опасным оборудованием.
Модель доступна разработчикам через Gemini API и Google AI Studio, а также через пример в Google Colab. Это означает, что не только крупные компании вроде Boston Dynamics, но и стартапы и исследователи могут экспериментировать с воплощённым ИИ. Переход от заранее запрограммированных сценариев к автономному рассуждению открывает новую эру в робототехнике — роботы перестают быть просто исполнителями и становятся самостоятельными агентами.
Выход Gemini Robotics-ER 1.6 вписывается в масштабную стратегию Google DeepMind по созданию универсального физического ИИ. Вместе с ранее представленными моделями Gemini Robotics и партнёрствами с Agile Robots и Apptronik, компания формирует экосистему, где одна и та же базовая модель может управлять четвероногими роботами, гуманоидами и промышленными манипуляторами. По мнению аналитиков, к концу 2026 года автономная робоинспекция станет стандартом на крупных производственных предприятиях.






