Новый метод обучения роботов для безопасного движения рядом с людьми.

Введение в мир робототехники
Яндекс активно развивает проект Humanoids, направленный на создание гуманоидных роботов, способных работать в различных условиях.
Цель проекта
Цель проекта - создать роботов, которые смогут уверенно и безопасно работать рядом с людьми.
Проблема плавного движения
Одна из ключевых задач - научить роботов ходить плавно. Для этого тестируются разные RL-модели.
RL-модели и их ограничения
RL-модели позволяют роботам обучаться на основе опыта, но часто приводят к нестабильному движению.
Решение: Lipschitz-Constrained reinforcement learning
Был применён метод Lipschitz-Constrained reinforcement learning, который позволил добиться плавного движения робота.
- Улучшение стабильности движения
- Повышение безопасности взаимодействия с людьми
Принцип работы метода
Метод основан на контроле градиента функции потерь, что позволяет добиться более стабильного обучения.
В результате робот смог пройти 500 шагов подряд без падения.
Выводы и перспективы
Применение Lipschitz-Constrained reinforcement learning открывает новые возможности для развития робототехники.
Источник: Читать оригинал
Комментариев нет
Отправить комментарий