联合预测与规划的博弈论框架

摘要:计划在人类存在的情况下确保机器人运动的安全性需要可靠的人类未来运动预测。然而,仅仅预测先前互动中最有可能的运动并不能保证安全。这样的预测无法建模可能事件的长尾部分,在有限的数据集中很少观察到。另一方面,为最坏情况的运动进行规划会导致过于保守的行为和“僵化的机器人”。相反,我们的目标是学习预测人类防范的反事实预测。我们提出了一种新颖的博弈论框架,用于联合规划和预测,其中回报是规划器与演示者之间的性能,并提出了实际的算法来以端到端的方式训练模型。我们证明了我们提出的算法在人群导航模拟器和真实世界的行人运动数据集中可以得到更安全的规划结果。我们在https://github.com/portal-cornell/Game-Theoretic-Forecasting-Planning 上发布了我们的代码。

作者:Kushal Kedia, Prithwish Dan, Sanjiban Choudhury

论文ID:2308.06137

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-08-14

PDF 下载: 英文版 中文版pdf翻译中