StROL：稳定可靠的人类在线学习-arXiv论文预印本中文版

StROL：稳定可靠的人类在线学习

摘要：增强梯度下降学习规则在推断人类奖励参数时的鲁棒性和收敛性

作者：Shaunak A. Mehta, Forrest Meng, Andrea Bajcsy, and Dylan P. Losey

论文ID：2308.09863

分类：Robotics

分类简称：cs.RO

提交时间：2023-08-22

PDF 下载： 英文版中文版pdf翻译中