神经动力学中行为序列的自主强化-arXiv论文预印本中文版

神经动力学中行为序列的自主强化

摘要：动态神经（DN）SARSA(lambda)：一种学习延迟奖励下行为序列的动态神经算法的介绍

作者：Sohrob Kazerounian, Matthew Luciw, Mathis Richter and Yulia Sandamirskaya

论文ID：1210.3569

分类：Neural and Evolutionary Computing

分类简称：cs.NE

提交时间：2013-05-15

PDF 下载： 英文版中文版pdf翻译中