一个脉冲神经网络学习马尔可夫链-arXiv论文预印本中文版

一个脉冲神经网络学习马尔可夫链

摘要：在本文中，我们探讨了脉冲神经网络（SNN）如何学习和修复其内部结构的外部世界动态模型的问题。对于基于模型的强化学习（RL）的实现来说，这个问题非常重要，这是一种现实的强化学习模式，其中SNN做出的决策和根据奖励/惩罚信号对其评估的时间间隔和中间评估-中性世界状态的序列可能相隔相当长的时间。在本研究中，我将世界动态形式化为具有未知先验状态转移概率的马尔可夫链，这些概率应该由网络学习。为了使问题表述更加现实，我在连续时间上解决它，这样马尔可夫链中每个状态的持续时间可能不同且未知。我们演示了如何通过具有特殊设计的结构和局部突触可塑性规则的SNN来完成这个任务。作为例子，我们展示了这个网络模型在一个简单但非平凡的世界中的工作情况，即一个球在一个正方形箱子内移动，并以随机的新方向和速度反弹。

作者：Mikhail Kiselev

论文ID：2209.09572

分类：Neural and Evolutionary Computing

分类简称：cs.NE

提交时间：2022-09-21

PDF 下载： 英文版中文版pdf翻译中