通过风险规避策略学习实现稳健四足动物行走

摘要:提高四足机器人在恶劣地形中的稳健性是至关重要的。最近,强化学习在四足机器人的腿部运动中取得了有希望的结果,并且各种方法尝试整合特权提炼、场景建模和外部传感器来提高运动策略的泛化性和稳健性。然而,这些方法很难处理不确定的情况,如突然的地形变化或意外的外部力。在本文中,我们考虑了一种新的风险敏感视角来增强腿部运动的稳健性。具体来说,我们使用通过分位回归学习的分布值函数来模拟环境的aleatoric不确定性,并通过风险畸变度量来优化最坏情况下的策略学习的风险规避。在仿真环境和真实的Aliengo机器人上进行的大量实验证明我们的方法在处理各种外部干扰时高效,并且所得到的策略在恶劣和不确定的腿部运动情况下表现出了改进的稳健性。视频可以在https://risk-averse-locomotion.github.io/上获得。

作者:Jiyuan Shi, Chenjia Bai, Haoran He, Lei Han, Dong Wang, Bin Zhao, Xiu Li, Xuelong Li

论文ID:2308.09405

分类:Robotics

分类简称:cs.RO

提交时间:2023-08-21

PDF 下载: 英文版 中文版pdf翻译中