摘要:自动化通过使用人工反馈来消除误定奖励函数的影响的迭代奖励塑形方法(ITERS)
作者:Jasmina Gajcin, James McCarthy, Rahul Nair, Radu Marinescu, Elizabeth Daly, Ivana Dusparic
论文ID:2308.15969
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-08-31
PDF 下载: 英文版 中文版pdf翻译中