贝叶斯推理用于数据高效、可解释和安全的机器人运动规划:综述

摘要:贝叶斯推断在机器人运动规划中具有许多优势,包括:策略的不确定性量化、机器人动作的安全性(风险感知)和最优性保证、强化学习训练的数据效率以及减小机器人在实际任务中的模拟与真实之间的差距。然而,贝叶斯推断在机器人运动规划中的应用仍落后于贝叶斯推断的综合理论。此外,目前缺乏综合性的评述来总结贝叶斯推断在机器人运动规划中的进展,以便给研究人员提供系统的理解。本文首先介绍了贝叶斯推断的概率理论,这是处理复杂情况下贝叶斯推断的基础。其次,提供了贝叶斯估计的方法来估计策略或未知函数的后验概率,用于计算策略。第三,总结了经典的基于模型的贝叶斯强化学习和无模型的贝叶斯强化学习算法,同时还分析了这些算法在复杂情况下的应用。第四,介绍了贝叶斯推断在逆强化学习中的应用,以便以数据高效的方式推断奖励函数。第五,系统地介绍了贝叶斯推断和强化学习的混合方法,这是提高强化学习收敛性以实现更好运动规划的有希望的方向。第六,结合贝叶斯推断,提出了可解释和安全的机器人运动规划方法,这是近期的研究热点。最后,对本文中所审查的所有算法进行了概括性的分析,形成了知识图谱,并讨论了贝叶斯推断在机器人运动规划中的未来,为数据高效、可解释和安全的机器人运动规划策略的实际应用铺平道路。

作者:Chengmin Zhou, Chao Wang, Haseeb Hassan, Himat Shah, Bingding Huang, Pasi Fr"anti

论文ID:2307.08024

分类:Artificial Intelligence

分类简称:cs.AI

提交时间:2023-07-18

PDF 下载: 英文版 中文版pdf翻译中