摘要:增强梯度下降学习规则在推断人类奖励参数时的鲁棒性和收敛性
作者:Shaunak A. Mehta, Forrest Meng, Andrea Bajcsy, and Dylan P. Losey
论文ID:2308.09863
分类:Robotics
分类简称:cs.RO
提交时间:2023-08-22
PDF 下载: 英文版 中文版pdf翻译中