Google DeepMind запускает локальную ИИ-модель для роботов: новый уровень автономности и эффективности

Компания Google DeepMind представила новую языковую модель под названием Gemini Robotics On-Device, которая позволяет роботам работать автономно, без необходимости интернет-соединения.

«Это наша первая модель в области Vision-Language-Action (VLA), что позволит роботам стать более быстрыми, эффективными и адаптированными к различным задачам и условиям — и всё это без постоянного доступа к интернету», — отметили представители подразделения ИИ в Google.

«Сейчас Figure на основе подобных моделей демонстрирует свои совместные производственные решения», — добавил он.

В феврале компания Figure презентовала собственный ИИ под названием Helix, предназначенный для интеграции с роботами. По утверждению разработчиков, эта модель «может мыслить сблизи с человеческими рассуждениями». Оснащенные ИИ гуманоиды способны захватывать «практически любые бытовые предметы без предшествующего программирования или обучения».

Лоншаков описал локальную реализацию модели на устройстве как разумное решение, соответствующее современным тенденциям.

«[…] Теперь мы называем это высокоуровневым планировщиком задач — ранее он функционировал исключительно в облаке, применяясь с использованием RL для обучения простой модели в симуляции, а потом готовая последовательность операций загружалась в робота. Теперь инженеры-робототехники работают над seamless-моделями, в которых на этапе планирования отсутствуют блокирующие процессы, мешающие роботу переключаться между задачами. Если бот закончил скрутку деталей на конвейере и отправился за новыми компонентами, теперь никто не хочет ждать, пока он «переключит оснастку» в своей программе», — подытожил эксперт.

Ключевые характеристики Gemini Robotics On-Device:

Также был запущен SDK, который помогает разработчикам адаптировать модель под свои приложения, включая возможность тестирования в физическом симуляторе MuJoCo. Они могут применять команды на естественном языке.

Множество компаний продолжают активно работать в этой области. В июне появились сообщения о том, что Amazon разрабатывает ПО с ИИ, позволяющее человекоподобным роботам доставлять посылки на электрических фургонах Rivian.

В марте Nvidia представила систему для моделирования движений роботов.

Ранее 21 человекоподобный робот участвовал в полумарафоне, проходившем в Пекине, вместе с людьми.