朝向海马作为继承代理的生物模型
摘要:海马是空间记忆和学习的关键大脑区域。最近,基于时间差异(TD)学习的海马理论模型已经发表。受到继任者表征(SR)学习算法的启发,该模型将TD学习的值函数分解为奖励和状态转换,并认为海马CA1区位置细胞的发放率代表状态转换的概率。这个被称为预测地图理论的理论声称,代表空间的海马学习从当前状态到未来状态的转换概率。预期未来状态的神经相关是CA1区位置细胞的发放率。这个解释对于行为实验的记录结果是合理的,但它缺乏神经生物学的含义。 修改SR学习算法为预测地图理论增加了生物学上的含义。与SR学习算法中对当前状态和未来状态信息的同时需求类似,CA1位置细胞从CA3和内侧嗅皮层接收到两个输入。数学转换表明,SR学习算法等同于异突触可塑性规则。讨论了CA1区的异突触可塑性现象,并与修改后的SR更新规则进行了比较。这项研究试图解释TD算法作为发生在地点学习中的神经生物学机制,并将神经科学和人工智能的方法整合在这一领域中。
作者:Hyunsu Lee
论文ID:2006.11975
分类:Neurons and Cognition
分类简称:q-bio.NC
提交时间:2023-04-17