混合BDI-POMDP框架用于多智能体团队-arXiv论文预印本中文版

混合BDI-POMDP框架用于多智能体团队

摘要：基于信念-欲望-意图（BDI）范式的现有大规模多智能体团队实现，具有明确的团队计划表示。尽管有前景，但当前的BDI团队方法在不确定性下缺乏定量性能分析工具。分布式偏观察到的马尔可夫决策问题（POMDP）非常适合进行这种分析，但是在这种模型中寻找最优策略的复杂性非常难以处理。本文的主要贡献是一种BDI-POMDP混合方法，利用BDI团队计划来改进POMDP的可处理性，并且通过POMDP分析来提高BDI团队计划的性能。具体而言，我们关注BDI团队中的一项基本问题：角色分配，即将代理分配到团队中的不同角色。本文提供了三方面的关键贡献。首先，我们描述一种考虑领域未来不确定性的角色分配技术；以往的多智能体角色分配工作未能解决这种不确定性。为此，我们引入了一种新的分布式POMDP模型RMTDP（基于角色的马尔可夫团队决策问题），用于分析角色分配。我们的技术通过大大减少RMTDP策略搜索来提高可处理性；特别是，BDI团队计划提供了不完整的RMTDP策略，而RMTDP策略搜索则通过搜索最佳角色分配来填补这些不完整策略的空白。我们的第二个关键贡献是一种新颖的分解技术，进一步提高了RMTDP策略搜索的效率。即使限于搜索角色分配，仍然存在组合性很强的角色分配，而在RMTDP中评估每个角色分配以找出最佳的是非常困难的。我们的分解技术利用BDI团队计划中的结构来大大减少角色分配的搜索空间。我们的第三个关键贡献是一种更快速的策略评估算法，适用于我们的BDI-POMDP混合方法。最后，我们还呈现了两个领域的实验结果：任务演练模拟和RoboCupRescue灾害救援模拟。

作者：R. Nair, M. Tambe

论文ID：1109.2132

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2011-09-13

PDF 下载： 英文版中文版pdf翻译中