通过准度量学习的最优目标达成强化学习

摘要:基于准度量结构的强化学习方法:Quasimetric Reinforcement Learning (QRL)

作者:Tongzhou Wang, Antonio Torralba, Phillip Isola, Amy Zhang

论文ID:2304.01203

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-15

PDF 下载: 英文版 中文版pdf翻译中