通过准度量学习的最优目标达成强化学习-arXiv论文预印本中文版

通过准度量学习的最优目标达成强化学习

摘要：基于准度量结构的强化学习方法：Quasimetric Reinforcement Learning (QRL)

作者：Tongzhou Wang, Antonio Torralba, Phillip Isola, Amy Zhang

论文ID：2304.01203

分类：Machine Learning

分类简称：cs.LG

提交时间：2023-08-15

PDF 下载： 英文版中文版pdf翻译中