多智能体意图共享通过领导者-追随者森林-arXiv论文预印本中文版

多智能体意图共享通过领导者-追随者森林

摘要：部分可观察情况下多智能体强化学习中的意图共享十分重要。然而，当智能体根据接收到的意图同时改变策略时，意图传播与最终决策之间可能存在不匹配，即信息欺骗。信息欺骗会导致潜在的不协调和策略学习上的困难。本文提出了基于依赖性的领导-追随森林（LFF），以学习智能体之间的层次关系，实现多智能体通信中的单向意图共享。通过限制意图沿着有向边的流动，通过LFF实现的意图共享（IS-LFF）能够有效消除信息欺骗，并实现更好的协调。此外，还提出了一个两阶段学习算法来训练森林和智能体网络。我们在多个部分可观察的MARL基准测试中评估了IS-LFF，并实验结果表明我们的方法优于最先进的通信算法。

作者：Zeyang Liu, Lipeng Wan, Xue sui, Kewu Sun, Xuguang Lan

论文ID：2112.01078

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2021-12-03

PDF 下载： 英文版中文版pdf翻译中