基于世界模型的多物体工业装箱的牛顿VAE控制

摘要:工业装箱过程涉及到多个物体的准确放置,需要高精度的定位和顺序动作。当一个机器人被指定以高精度放置物体的特定位置时,不仅需要有关待放置物体的位置信息,还需要有关机器人手抓取物体的姿态信息。通常,工业装箱需要将形状相同的物体顺序放置到一个箱子中。机器人的动作应由同一学习模型确定。在工厂中,新型产品经常出现,需要一个可以轻松适应它们的模型。因此,收集数据以训练该模型应该很容易。在这项研究中,我们设计了一个机器人系统来自动化真实世界的工业任务,采用基于视觉的学习控制模型。我们提出了一种基于手持视角敏感的牛顿变分自编码器(ihVS-NVAE),它采用RGB摄像头获取物体的手持姿势。我们证明了我们训练用于单个物体放置任务的模型能够处理顺序任务而无需额外训练。为了评估所提模型的有效性,我们采用一个真实的机器人执行多个物体的顺序工业装箱任务。结果显示,所提模型在工业装箱任务中实现了100%的成功率,超过了最先进的和传统的方法,凸显了其在工业任务中的优越效果和潜力。

作者:Yusuke Kato, Ryo Okumura, Tadahiro Taniguchi

论文ID:2308.02136

分类:Robotics

分类简称:cs.RO

提交时间:2023-08-07

PDF 下载: 英文版 中文版pdf翻译中