StROL:稳定可靠的人类在线学习

摘要:增强梯度下降学习规则在推断人类奖励参数时的鲁棒性和收敛性

作者:Shaunak A. Mehta, Forrest Meng, Andrea Bajcsy, and Dylan P. Losey

论文ID:2308.09863

分类:Robotics

分类简称:cs.RO

提交时间:2023-08-22

PDF 下载: 英文版 中文版pdf翻译中