针对针的深度视觉运动策略的端到端学习

摘要:针挑选是机器人辅助手术中具有挑战性的操作任务,由于针具具有细长的形状、形状和尺寸的变化以及对毫米级控制的需求。先前的工作非常依赖于针具的先验知识(例如几何模型),很难扩展到未知的针具变化。在本文中,我们提出了第一个端到端学习方法,用于训练深度视觉运动策略以进行针挑选。具体而言,我们提出了DreamerfD,以最大限度地利用示范来提高最先进的基于模型的强化学习方法DreamerV2的学习效率;由于DreamerV2中的VAE难以扩展到高分辨率图像,我们提出了动态聚光适应方法,在低分辨率图像空间中表示与控制相关的视觉信号;我们还提出了虚拟离合器,以减少由于滚动开始时先验编码状态与后验编码状态之间的显著误差而导致的性能下降。我们在仿真环境中进行了广泛的实验,评估了我们方法的性能、鲁棒性、领域内变化适应性以及各个组成部分的有效性。我们的方法通过8k个示范时间步长和140k个在线策略时间步长进行训练后,可以实现出色的80%的成功率。此外,我们的方法在泛化到未知的领域内变化中(包括针具变化和图像干扰)有效地展示了其优越性,突显了其鲁棒性和多功能性。代码和视频可在https://sites.google.com/view/DreamerfD上找到。

作者:Hongbin Lin, Bin Li, Xiangyu Chu, Qi Dou, Yunhui Liu and Kwok Wai Samuel Au

论文ID:2303.03675

分类:Robotics

分类简称:cs.RO

提交时间:2023-07-27

PDF 下载: 英文版 中文版pdf翻译中