学习使用空中操纵器打开门-arXiv论文预印本中文版

学习使用空中操纵器打开门

摘要：空中操纵领域取得了快速的发展，从推和滑动任务过渡到与关节对象的交互。到目前为止，在执行更复杂的动作时，运动轨迹通常是手工设计或在线优化方法（如模型预测控制（MPC）或模型预测路径积分（MPPI）控制）的结果。然而，这些方法依赖于启发式算法或模型简化以在机载硬件上高效运行，并在合理的时间内产生结果。此外，它们可能对干扰和真实环境与其模拟对应物之间的差异敏感。在这项工作中，我们提出了一种强化学习（RL）方法，以学习机器人在操纵任务中的运动行为，并生成对干扰和建模错误具有鲁棒性的策略。具体而言，我们训练一种在物理模拟器中执行开门任务的策略，使用全向微型飞行器（OMAV）进行实验，并在模拟和真实平台上进行测试，研究模拟到现实世界的转移。我们将我们的方法与一种最先进的MPPI解决方案进行比较，显示出显著的鲁棒性和速度提升。

作者：Eugenio Cuniato, Ismail Geles, Weixuan Zhang, Olov Andersson, Marco Tognon, Roland Siegwart

论文ID：2307.15581

分类：Robotics

分类简称：cs.RO

提交时间：2023-07-31

PDF 下载： 英文版中文版pdf翻译中