多智能体强化学习系统中的可扩展性瓶颈-arXiv论文预印本中文版

多智能体强化学习系统中的可扩展性瓶颈

摘要：多Agent强化学习（MARL）是一个有前途的研究领域，可以建立和控制多个自主决策Agent。在在线训练过程中，MARL算法涉及性能密集的计算，如来自多个Agent的大观测-动作空间的探索和开发阶段。在本文中，我们试图表征几种流行的MARL算法在训练阶段的可扩展性瓶颈。我们的实验结果揭示了限制可扩展性的MARL算法的关键模块的新见解，并概述了可能有助于解决这些性能问题的潜在策略。

作者：Kailash Gogineni, Peng Wei, Tian Lan, Guru Venkataramani

论文ID：2302.05007

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2023-02-13

PDF 下载： 英文版中文版pdf翻译中