多智能体强化学习系统中的可扩展性瓶颈
摘要:多Agent强化学习(MARL)是一个有前途的研究领域,可以建立和控制多个自主决策Agent。在在线训练过程中,MARL算法涉及性能密集的计算,如来自多个Agent的大观测-动作空间的探索和开发阶段。在本文中,我们试图表征几种流行的MARL算法在训练阶段的可扩展性瓶颈。我们的实验结果揭示了限制可扩展性的MARL算法的关键模块的新见解,并概述了可能有助于解决这些性能问题的潜在策略。
作者:Kailash Gogineni, Peng Wei, Tian Lan, Guru Venkataramani
论文ID:2302.05007
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2023-02-13