神经动力学中行为序列的自主强化

摘要:动态神经(DN)SARSA(lambda):一种学习延迟奖励下行为序列的动态神经算法的介绍

作者:Sohrob Kazerounian, Matthew Luciw, Mathis Richter and Yulia Sandamirskaya

论文ID:1210.3569

分类:Neural and Evolutionary Computing

分类简称:cs.NE

提交时间:2013-05-15

PDF 下载: 英文版 中文版pdf翻译中