基于模型的随机搜索用于多智能体无人机群体大规模优化-arXiv论文预印本中文版

基于模型的随机搜索用于多智能体无人机群体大规模优化

摘要：进化策略是一种快速且可扩展的替代强化学习方法，本文显示进化策略是一类基于模型的随机搜索方法的特例。这类算法具有良好的渐近收敛特性和已知的收敛速率。我们展示了这些方法如何有效地解决合作和竞争多智能体问题。我们在两个复杂的多智能体无人机群体战斗场景中展示了这种方法的有效性：一个固定翼飞机团队必须攻击一个防守严密的基地，和两个团队的智能体互相对抗。

作者：David D. Fan, Evangelos Theodorou, and John Reeder

论文ID：1803.01106

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2018-08-14

PDF 下载： 英文版中文版pdf翻译中