比较强化学习和人类学习：以《隐藏规则游戏》为例-arXiv论文预印本中文版

比较强化学习和人类学习：以《隐藏规则游戏》为例

摘要：在可靠地部署强化学习（RL）方法的现实世界中，需要对其优势和弱点以及与人类的比较有一个细致的理解。人机系统变得越来越普遍，这些系统的设计依赖于对人类学习（HL）和RL的任务导向理解。因此，一个重要的研究方向是描述学习任务的结构如何影响学习表现。尽管越来越复杂的基准环境已经提高了RL的能力，但这些环境很难用于专门研究任务结构。为了解决这一挑战，我们提出了一个学习环境，用于支持任务结构对HL和RL影响的严谨研究。通过任务结构的示例实验，我们展示了该环境在此类研究中的实用性，揭示了人类与RL算法之间的性能差异。

作者：Eric Pulick, Vladimir Menkov, Yonatan Mintz, Paul Kantor, Vicki Bier

论文ID：2306.17766

分类：Artificial Intelligence

分类简称：cs.AI

提交时间：2023-07-03

PDF 下载： 英文版中文版pdf翻译中