多智能体系统中的稳健性和泛化能力基准测试:神经MMO的案例研究
摘要:第二届神经MMO挑战赛的结果:参赛人数1600+,该赛事针对多智能体系统中的强健性和泛化性进行,参赛者训练一组智能体以完成多任务目标,对手在训练过程中未见过。赛事结合了相对复杂的环境设计和大量智能体的存在。前几名的参赛作品使用主要基于强化学习方法(RL)结合领域特定工程开展,展现了在该任务上的强大成效。我们总结了赛事设计和结果,并建议竞赛作为一个学术团体解决难题和建立坚实基准算法的强有力的途径。我们将开源我们的基准,包括环境包装器、基准策略、可视化工具等,以供进一步研究使用。
作者:Yangkun Chen, Joseph Suarez, Junjie Zhang, Chenghui Yu, Bo Wu, Hanmo Chen, Hengman Zhu, Rui Du, Shanliang Qian, Shuai Liu, Weijun Hong, Jinke He, Yibing Zhang, Liang Zhao, Clare Zhu, Julian Togelius, Sharada Mohanty, Jiaxin Chen, Xiu Li, Xiaolong Zhu, Phillip Isola
论文ID:2308.15802
分类:Artificial Intelligence
分类简称:cs.AI
提交时间:2023-08-31