朝向海马作为继承代理的生物模型-arXiv论文预印本中文版

朝向海马作为继承代理的生物模型

摘要：海马是空间记忆和学习的关键大脑区域。最近，基于时间差异（TD）学习的海马理论模型已经发表。受到继任者表征（SR）学习算法的启发，该模型将TD学习的值函数分解为奖励和状态转换，并认为海马CA1区位置细胞的发放率代表状态转换的概率。这个被称为预测地图理论的理论声称，代表空间的海马学习从当前状态到未来状态的转换概率。预期未来状态的神经相关是CA1区位置细胞的发放率。这个解释对于行为实验的记录结果是合理的，但它缺乏神经生物学的含义。修改SR学习算法为预测地图理论增加了生物学上的含义。与SR学习算法中对当前状态和未来状态信息的同时需求类似，CA1位置细胞从CA3和内侧嗅皮层接收到两个输入。数学转换表明，SR学习算法等同于异突触可塑性规则。讨论了CA1区的异突触可塑性现象，并与修改后的SR更新规则进行了比较。这项研究试图解释TD算法作为发生在地点学习中的神经生物学机制，并将神经科学和人工智能的方法整合在这一领域中。

作者：Hyunsu Lee

论文ID：2006.11975

分类：Neurons and Cognition

分类简称：q-bio.NC

提交时间：2023-04-17

PDF 下载： 英文版中文版pdf翻译中