多智能体意图共享通过领导者-追随者森林
摘要:部分可观察情况下多智能体强化学习中的意图共享十分重要。然而,当智能体根据接收到的意图同时改变策略时,意图传播与最终决策之间可能存在不匹配,即信息欺骗。信息欺骗会导致潜在的不协调和策略学习上的困难。本文提出了基于依赖性的领导-追随森林(LFF),以学习智能体之间的层次关系,实现多智能体通信中的单向意图共享。通过限制意图沿着有向边的流动,通过LFF实现的意图共享(IS-LFF)能够有效消除信息欺骗,并实现更好的协调。此外,还提出了一个两阶段学习算法来训练森林和智能体网络。我们在多个部分可观察的MARL基准测试中评估了IS-LFF,并实验结果表明我们的方法优于最先进的通信算法。
作者:Zeyang Liu, Lipeng Wan, Xue sui, Kewu Sun, Xuguang Lan
论文ID:2112.01078
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2021-12-03