Google DeepMind представила Gemini Robotics AI — автономную модель для роботов
Google DeepMind представила локальную версию модели искусственного интеллекта Gemini Robotics, которая работает без подключения к интернету. Это обновление стало значительным шагом вперед по сравнению с предыдущими облачными решениями.
Vision-Language-Action (VLA) — это тип ИИ, сочетающий зрение, язык и действия. Такие модели позволяют роботам понимать окружение, обрабатывать инструкции и выполнять задачи без постоянного облачного подключения.
Ключевые преимущества
- Автономность: работает в удаленных зонах и местах с плохим интернетом.
- Конфиденциальность: данные обрабатываются локально, что критично для медицины и промышленности.
- Скорость: низкая задержка при выполнении задач.
Что умеет Gemini Robotics?
Модель демонстрирует впечатляющую универсальность:
- Открывает ящики, закрывает контейнеры, расстегивает молнии.
- Адаптируется к новым объектам и окружениям.
- Работает на разных роботизированных платформах, включая Apollo и Franka FR3.
Сравнение с облачной версией
Тесты показали:
- Визуальное обобщение — почти на уровне облачного аналога.
- Семантическое обобщение — немного хуже.
- Скорость адаптации — сопоставима, учится новому за 50-100 демонстраций.
Для сравнения, Tesla Optimus требует интернет-подключения даже для простых задач вроде складывания одежды.
Перспективы
Локальный ИИ открывает возможности для:
- Промышленной автоматизации в изолированных зонах.
- Медицинских роботов, работающих с конфиденциальными данными.
- Экстренных служб в условиях разрушенной инфраструктуры.
Технология пока не идеальна, но уже сейчас показывает, что будущее робототехники может быть оффлайн.