基于扭矩的深度强化学习用于双足机器人的任务和机器人不可知学习:模拟到真实迁移

摘要:采用何种行动空间与Sim2Real训练结合,以控制真实双足机器人的问题一直备受关注。由于位置控制显示出更高的样本效率,并且易于与其他规划算法结合,因此一直很受欢迎。然而,为了实现最佳的政策表现,需要进行位置控制增益调整。本文表明,相反地,使用基于扭矩的行动空间可以实现任务和机器人无关的学习,并减少参数调整,并通过利用扭矩控制的固有适应性来减小仿真到真实世界的差距。此外,我们通过预先训练策略以抵消重力来加速基于扭矩的策略训练过程。本文展示了在真实尺寸的双足机器人上成功实现基于扭矩的深度强化学习策略的仿真到实际的转移。视频可在https://youtu.be/CR6pTS39VRE上观看。

作者:Donghyeon Kim, Glen Berseth, Mathew Schwartz, Jaeheung Park

论文ID:2304.09434

分类:Robotics

分类简称:cs.RO

提交时间:2023-09-01

PDF 下载: 英文版 中文版pdf翻译中