多智能体强化学习系统中的可扩展性瓶颈

摘要:多Agent强化学习(MARL)是一个有前途的研究领域,可以建立和控制多个自主决策Agent。在在线训练过程中,MARL算法涉及性能密集的计算,如来自多个Agent的大观测-动作空间的探索和开发阶段。在本文中,我们试图表征几种流行的MARL算法在训练阶段的可扩展性瓶颈。我们的实验结果揭示了限制可扩展性的MARL算法的关键模块的新见解,并概述了可能有助于解决这些性能问题的潜在策略。

作者:Kailash Gogineni, Peng Wei, Tian Lan, Guru Venkataramani

论文ID:2302.05007

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2023-02-13

PDF 下载: 英文版 中文版pdf翻译中