基于分层图学习的熵增强多智能体协调在连续动作空间中
摘要:大规模多智能体协调中,在大多数现有的研究中,控制方法旨在为具有有限选择的智能体学习离散策略。它们很少考虑直接从连续动作空间中选择动作来提供更准确的控制,这使它们不适用于更复杂的任务。为了解决由具有连续动作空间的大规模多智能体系统引起的控制问题,我们提出了一种新颖的MARL协调控制方法,可以得到稳定的连续策略。通过最大熵学习优化策略,智能体在执行中改善了其探索能力,并在训练后获得了出色的性能。我们还采用了分层图注意力网络(HGAT)和门控循环单元(GRU)来提高我们方法的可扩展性和可转移性。实验表明,我们的方法在大规模多智能体合作侦察任务中始终优于所有基线方法。
作者:Yining Chen, Ke Wang, Guanghua Song, Xiaohong Jiang
论文ID:2208.10676
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2022-08-24