使用多智能体展开控制策略优化基于共识的多目标跟踪

摘要:分布式多传感器控制策略对多智能体、连通的机器人舰队进行了考虑,其中智能体的主要功能是感知。使用信息驱动方法,最大化舰队的集体感知能力的价值。每个智能体通过与邻居的通信,使用信息共识方法增强轨迹的预测,该方法通过迭代计算轨迹分布的Kullback-Leibler平均值,从而计算舰队的集体信息价值。智能体的动力学,每个智能体识别出的轨迹的演变以及个体观测到的对象的动力学被捕获为部分可观察的马尔可夫决策过程(POMDP)。利用这个POMDP并应用具有消退水平控制的滚动,合成了一种优化的非迂腐控制策略,最大化了集体舰队信息价值。进行了模拟实验,研究了三个异构无人机协同目标追踪的场景,展示了所提出的方法并与现代顺序多智能体分布式决策技术进行了比较。

作者:Tianqi Li, Lucas W. Krakow and Swaminathan Gopalswamy

论文ID:2102.02919

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2022-03-04

PDF 下载: 英文版 中文版pdf翻译中