开放和类型化多智能体系统中可扩展的决策论规划

摘要:在开放的代理系统中,合作或竞争的代理集合会随时间变化,这种变化很难预测。例如,如果协作机器人的任务是扑灭森林大火,它们可能会用光压制剂并暂时无法帮助其他机器人。我们考虑在这些环境下的规划问题,其中额外的挑战是代理之间无法进行通信,并且代理的数量很多。因为一个代理的最佳行动取决于其他代理的行动,所以每个代理不仅需要预测其他代理的行动,还需要首先判断它们是否存在来执行行动。因此,解决开放性问题需要代理模型化彼此的存在,但是当代理数量很多时,这个计算问题变得难以处理。我们在这个背景下提出了一种新颖、有原则且可扩展的方法,使代理能够推理共享环境中其他代理的存在和行动。我们的方法通过对少数同行的模型进行外推,结合通用的Monte Carlo树搜索的泛化,实现了多代理开放环境下的单个代理推理。理论分析确定了需要对多少代理进行建模以实现在外推误差上达到可接受的最坏情况界限,以及对仅模拟某些邻居的代理的后悔界限。应用于多代理森林火灾扑灭问题的仿真实验证明了我们方法与其他对比基线的效果。

作者:Adam Eck, Maulik Shah, Prashant Doshi, and Leen-Kiat Soh

论文ID:1911.08642

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2019-11-21

PDF 下载: 英文版 中文版pdf翻译中