通过多智能体强化学习实现复杂护卫行为的出现

摘要:保护重要人物的机器人团队在拥挤的公共场所提供物理保护。我们展示了这个问题涉及重要人物与机器人之间的复杂交互,机器人之间以及机器人与旁观者之间的交互网。我们展示了最近提出的多智能体策略梯度强化学习算法(如MADDPG)如何成功适应学习协同机器人行为以保护重要人物。

作者:Hassam Ullah Sheikh, Ladislau B"ol"oni

论文ID:1901.09833

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2019-01-29

PDF 下载: 英文版 中文版pdf翻译中