无地图导航的混合空中水下飞行器的双批评者深度强化学习-arXiv论文预印本中文版

无地图导航的混合空中水下飞行器的双批评者深度强化学习

摘要：基于双批判者演员-批判者算法的深度强化学习用于处理各种机器人的决策问题，包括空中水下混合无人机的无地图导航。本文介绍了新的方法，采用双批判者深度强化学习与递归神经网络结合使用范围数据和相对定位来改善空中水下混合无人机的导航性能和介质转换能力。我们的方法在导航和介质转换方面表现优于以往的方法。

作者：Ricardo B. Grando, Junior C. de Jesus, Victor A. Kich, Alisson H. Kolling, Rodrigo S. Guerra, Paulo L. J. Drews-Jr

论文ID：2308.09811

分类：Robotics

分类简称：cs.RO

提交时间：2023-08-22

PDF 下载： 英文版中文版pdf翻译中