多智能体通过无监督学习联合意图进行合作-arXiv论文预印本中文版

多智能体通过无监督学习联合意图进行合作

摘要：合作型多智能体强化学习（MARL）领域已被广泛应用于解决复杂的协调任务。尽管在MARL中，价值分解方法很受欢迎，但它们在解决具有非单调回报的任务时存在局限性，限制了它们的一般应用。我们的工作强调了合作中联合意图的重要性，它可以克服非单调问题并增加学习过程的可解释性。为此，我们提出了一种利用可学习的联合意图的新型MARL方法。我们的方法采用了一个层次框架，包括联合意图策略和行为策略，来制定最优的合作策略。联合意图通过无监督学习在潜在空间中自主学习，并使该方法适应不同的智能体配置。我们的结果在StarCraft微管理基准测试和具有挑战性的MAgent领域中展示了显著的性能改进，展示了我们方法在学习有意义的联合意图方面的有效性。

作者：Shanqi Liu, Weiwei Liu, Wenzhou Chen, Guanzhong Tian, Yong Liu

论文ID：2307.02200

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2023-07-06

PDF 下载： 英文版中文版pdf翻译中