Основатель и генеральный директор Figure Бретт Адкок представил инновационную модель машинного обучения для человекоподобных роботов. Это событие произошло спустя две недели после того, как робототехническая компания Bay Area прекратила сотрудничество с OpenAI и сосредоточила усилия на разработке собственной универсальной модели Vision-Language-Action (VLA) под названием Helix.
VLA — новое направление в робототехнике, позволяющее системам анализировать окружающую среду и реагировать на неё, используя как визуальные данные, так и текстовые команды. Это значительно повышает адаптивность роботов и их способность взаимодействовать с внешним миром.
На данный момент одной из наиболее известных VLA-систем является RT-2 от Google DeepMind, которая сочетает видеоматериалы с большими языковыми моделями (LLM) для обучения роботов. Аналогичный подход использован в Helix: робот получает визуальные данные и текстовые инструкции, что позволяет ему действовать в реальном времени.
Искусственный интеллект, способный понимать язык и зрение
По словам разработчиков, Helix открывает новые возможности в обучении роботизированных систем. Теперь Figure может распознавать и классифицировать широкий спектр объектов, анализируя их форму, цвет, размер и материалы. Более того, система способна работать с ранее незнакомыми предметами, просто получая описание на естественном языке.
Helix устраняет разрыв между визуальным восприятием и обработкой языка. Робот, получив голосовую команду, анализирует окружающую обстановку, а затем выполняет указанное действие. Например, он может обработать запросы вроде:
- «Передай пакет с печеньем роботу справа»
- «Возьми пакет с печеньем у робота слева и положи его в открытый ящик».
Одной из ключевых особенностей новой системы является возможность координации нескольких роботов, работающих совместно. В тестовых сценариях Helix управляла двумя роботами, где один помогал другому выполнять бытовые задачи.
Домашние роботы: вызовы и перспективы
Разработчики не только продемонстрировали функциональность модели VLA, но и рассказали об особенностях обучения роботов в домашних условиях. В отличие от предсказуемых промышленных сред, таких как склады и производства, бытовая обстановка более хаотична, что усложняет автоматизацию.
Основные барьеры на пути массового внедрения человекоподобных роботов — сложность программирования и высокая стоимость. В настоящее время обучение машин требует значительных затрат труда: либо программирования вручную, либо тысяч демонстраций действий. Однако для работы в доме этот подход малоприменим, поскольку условия постоянно меняются:
- кухни, гостиные и ванные комнаты отличаются друг от друга;
- бытовая техника и мебель могут быть расставлены по-разному;
- уровень освещения варьируется, а люди создают беспорядок и переставляют предметы.
В компании Figure подчеркивают, что роботы будущего должны самостоятельно адаптироваться к новой обстановке и обучаться в режиме реального времени, без необходимости длительного программирования.
Helix — только начало
Как и большинство современных разработок в области гуманоидной робототехники, Helix пока находится на раннем этапе. Фактически, презентация компании — это стратегический шаг по привлечению новых специалистов в проект.
Стоит отметить, что в последние дни о своём прогрессе в создании человекоподобных роботов заявила и компания Clone Robotics. Их новый прототип Clone Alpha оснащен скелетно-мышечной системой, имитирующей движения человека. Эта разработка делает робота значительно более подвижным и адаптивным, что повышает его потенциал для использования в бытовой сфере.
Таким образом, несмотря на существующие технологические вызовы, отрасль гуманоидных роботов активно развивается, предлагая всё более сложные и интеллектуальные решения.