摘要:动态神经(DN)SARSA(lambda):一种学习延迟奖励下行为序列的动态神经算法的介绍
作者:Sohrob Kazerounian, Matthew Luciw, Mathis Richter and Yulia Sandamirskaya
论文ID:1210.3569
分类:Neural and Evolutionary Computing
分类简称:cs.NE
提交时间:2013-05-15
PDF 下载: 英文版 中文版pdf翻译中