学习使用空中操纵器打开门

摘要:空中操纵领域取得了快速的发展,从推和滑动任务过渡到与关节对象的交互。到目前为止,在执行更复杂的动作时,运动轨迹通常是手工设计或在线优化方法(如模型预测控制(MPC)或模型预测路径积分(MPPI)控制)的结果。然而,这些方法依赖于启发式算法或模型简化以在机载硬件上高效运行,并在合理的时间内产生结果。此外,它们可能对干扰和真实环境与其模拟对应物之间的差异敏感。在这项工作中,我们提出了一种强化学习(RL)方法,以学习机器人在操纵任务中的运动行为,并生成对干扰和建模错误具有鲁棒性的策略。具体而言,我们训练一种在物理模拟器中执行开门任务的策略,使用全向微型飞行器(OMAV)进行实验,并在模拟和真实平台上进行测试,研究模拟到现实世界的转移。我们将我们的方法与一种最先进的MPPI解决方案进行比较,显示出显著的鲁棒性和速度提升。

作者:Eugenio Cuniato, Ismail Geles, Weixuan Zhang, Olov Andersson, Marco Tognon, Roland Siegwart

论文ID:2307.15581

分类:Robotics

分类简称:cs.RO

提交时间:2023-07-31

PDF 下载: 英文版 中文版pdf翻译中