多智能体强化学习中动作价值网络的表征能力

摘要:深度强化学习在协作多智能体系统中的应用取得了极大的实证成功。然而,由于缺乏理论洞察力,目前并不清楚所使用的神经网络学习到了什么,或者我们应该如何增强其表征能力以解决它们无法处理的问题。在本文中,我们在一系列一次性游戏中对各种网络架构的表征能力进行了实证研究。尽管这些游戏很简单,但它们涵盖了在多智能体环境中出现的许多关键问题,如指数级数量的联合动作或缺乏明确的协调机制。我们的结果量化了各种方法在表示所需值函数方面的表现,并帮助我们确定可能妨碍良好性能的问题。

作者:Jacopo Castellini, Frans A. Oliehoek, Rahul Savani, Shimon Whiteson

论文ID:1902.07497

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2019-04-11

PDF 下载: 英文版 中文版pdf翻译中