空间学习中的鲁棒决策:继承特征和前任特征算法的比较研究
摘要:预测地图理论是解释动物空间学习的理论之一,它基于继承者表示(SR)学习算法。在现实世界中,动物和机器人等代理将受到嘈杂观察的影响,可能导致学习过程中的次优行动甚至失败。在本研究中,我们比较了在嘈杂的一维迷宫环境中继承者特征(SF)和前导特征(PF)算法的性能。我们的结果表明,PF在累积奖励和平均步长方面始终优于SF,并且对噪声具有更高的弹性。这种优势可能是由于PF能够将时间差错传递到更多的前导状态。我们还讨论了PF学习空间导航的生物学机制。本研究为使用强化学习算法的计算神经科学的理论研究做出了贡献,并突显了PF在机器人技术、游戏人工智能和自动驾驶导航方面的实际潜力。
作者:Hyunsu Lee
论文ID:2304.06894
分类:Neural and Evolutionary Computing
分类简称:cs.NE
提交时间:2023-04-17