通过多智能体强化学习实现复杂护卫行为的出现-arXiv论文预印本中文版

通过多智能体强化学习实现复杂护卫行为的出现

摘要：保护重要人物的机器人团队在拥挤的公共场所提供物理保护。我们展示了这个问题涉及重要人物与机器人之间的复杂交互，机器人之间以及机器人与旁观者之间的交互网。我们展示了最近提出的多智能体策略梯度强化学习算法（如MADDPG）如何成功适应学习协同机器人行为以保护重要人物。

作者：Hassam Ullah Sheikh, Ladislau B"ol"oni

论文ID：1901.09833

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2019-01-29

PDF 下载： 英文版中文版pdf翻译中