通过多智能体强化学习实现复杂护卫行为的出现
摘要:保护重要人物的机器人团队在拥挤的公共场所提供物理保护。我们展示了这个问题涉及重要人物与机器人之间的复杂交互,机器人之间以及机器人与旁观者之间的交互网。我们展示了最近提出的多智能体策略梯度强化学习算法(如MADDPG)如何成功适应学习协同机器人行为以保护重要人物。
作者:Hassam Ullah Sheikh, Ladislau B"ol"oni
论文ID:1901.09833
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2019-01-29