多智能体通过无监督学习联合意图进行合作
摘要:合作型多智能体强化学习(MARL)领域已被广泛应用于解决复杂的协调任务。尽管在MARL中,价值分解方法很受欢迎,但它们在解决具有非单调回报的任务时存在局限性,限制了它们的一般应用。我们的工作强调了合作中联合意图的重要性,它可以克服非单调问题并增加学习过程的可解释性。为此,我们提出了一种利用可学习的联合意图的新型MARL方法。我们的方法采用了一个层次框架,包括联合意图策略和行为策略,来制定最优的合作策略。联合意图通过无监督学习在潜在空间中自主学习,并使该方法适应不同的智能体配置。我们的结果在StarCraft微管理基准测试和具有挑战性的MAgent领域中展示了显著的性能改进,展示了我们方法在学习有意义的联合意图方面的有效性。
作者:Shanqi Liu, Weiwei Liu, Wenzhou Chen, Guanzhong Tian, Yong Liu
论文ID:2307.02200
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2023-07-06