比较强化学习和人类学习:以《隐藏规则游戏》为例
摘要:在可靠地部署强化学习(RL)方法的现实世界中,需要对其优势和弱点以及与人类的比较有一个细致的理解。人机系统变得越来越普遍,这些系统的设计依赖于对人类学习(HL)和RL的任务导向理解。因此,一个重要的研究方向是描述学习任务的结构如何影响学习表现。尽管越来越复杂的基准环境已经提高了RL的能力,但这些环境很难用于专门研究任务结构。为了解决这一挑战,我们提出了一个学习环境,用于支持任务结构对HL和RL影响的严谨研究。通过任务结构的示例实验,我们展示了该环境在此类研究中的实用性,揭示了人类与RL算法之间的性能差异。
作者:Eric Pulick, Vladimir Menkov, Yonatan Mintz, Paul Kantor, Vicki Bier
论文ID:2306.17766
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-07-03