空间学习中的鲁棒决策：继承特征和前任特征算法的比较研究-arXiv论文预印本中文版

空间学习中的鲁棒决策：继承特征和前任特征算法的比较研究

摘要：预测地图理论是解释动物空间学习的理论之一，它基于继承者表示（SR）学习算法。在现实世界中，动物和机器人等代理将受到嘈杂观察的影响，可能导致学习过程中的次优行动甚至失败。在本研究中，我们比较了在嘈杂的一维迷宫环境中继承者特征（SF）和前导特征（PF）算法的性能。我们的结果表明，PF在累积奖励和平均步长方面始终优于SF，并且对噪声具有更高的弹性。这种优势可能是由于PF能够将时间差错传递到更多的前导状态。我们还讨论了PF学习空间导航的生物学机制。本研究为使用强化学习算法的计算神经科学的理论研究做出了贡献，并突显了PF在机器人技术、游戏人工智能和自动驾驶导航方面的实际潜力。

作者：Hyunsu Lee

论文ID：2304.06894

分类：Neural and Evolutionary Computing

分类简称：cs.NE

提交时间：2023-04-17

PDF 下载： 英文版中文版pdf翻译中