GCS:基于图的多智能体强化学习协调策略
摘要:图分解的协调多智能体决策策略运用优化图生成器和基于图的协调策略使多智能体能够在复杂和动态环境中产生协同行为。图生成器采用编码器-解码器框架输出有向无环图(DAG)来捕捉底层动态决策结构。我们还在图生成器中应用了面向DAG性质和面向DAG深度的优化,以平衡效率和性能。基于图的协调策略利用生成的决策结构。图生成器和协调策略同时进行训练以最大化折扣回报。在协同高斯挤压、合作导航和Google Research Football等实证评估中,我们证明了所提方法的优越性。
作者:Jingqing Ruan, Yali Du, Xuantang Xiong, Dengpeng Xing, Xiyun Li, Linghui Meng, Haifeng Zhang, Jun Wang, Bo Xu
论文ID:2201.06257
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2022-01-19