分布式强化学习实现鲁棒无人水面航行器导航-arXiv论文预印本中文版

分布式强化学习实现鲁棒无人水面航行器导航

摘要：自主导航的无人船只在带有洋流的海洋环境中具有挑战性，很少有先前的研究解决了在没有对洋流和障碍物的先前知识的情况下，在这种环境下的传感器导航问题。我们提出了一种基于分布式强化学习（RL）的本地路径规划器，该规划器学习捕捉行动结果不确定性的回报分布，并使用自适应算法自动调整对环境风险敏感程度的水平。所提出的规划器实现了更稳定的学习性能，并收敛到比传统的基于RL的规划器更安全的策略。计算实验表明，与传统RL规划器和经典的本地规划方法（如人工势场和Bug算法）相比，所提出的规划器在环境洋流下具有鲁棒性，并能够计划出在安全、时间和能源消耗方面更优越的轨迹。

作者：Xi Lin, John McConnell and Brendan Englot

论文ID：2307.16240

分类：Robotics

分类简称：cs.RO

提交时间：2023-08-01

PDF 下载： 英文版中文版pdf翻译中