混合BDI-POMDP框架用于多智能体团队
摘要:基于信念-欲望-意图(BDI)范式的现有大规模多智能体团队实现,具有明确的团队计划表示。尽管有前景,但当前的BDI团队方法在不确定性下缺乏定量性能分析工具。分布式偏观察到的马尔可夫决策问题(POMDP)非常适合进行这种分析,但是在这种模型中寻找最优策略的复杂性非常难以处理。本文的主要贡献是一种BDI-POMDP混合方法,利用BDI团队计划来改进POMDP的可处理性,并且通过POMDP分析来提高BDI团队计划的性能。具体而言,我们关注BDI团队中的一项基本问题:角色分配,即将代理分配到团队中的不同角色。本文提供了三方面的关键贡献。首先,我们描述一种考虑领域未来不确定性的角色分配技术;以往的多智能体角色分配工作未能解决这种不确定性。为此,我们引入了一种新的分布式POMDP模型RMTDP(基于角色的马尔可夫团队决策问题),用于分析角色分配。我们的技术通过大大减少RMTDP策略搜索来提高可处理性;特别是,BDI团队计划提供了不完整的RMTDP策略,而RMTDP策略搜索则通过搜索最佳角色分配来填补这些不完整策略的空白。我们的第二个关键贡献是一种新颖的分解技术,进一步提高了RMTDP策略搜索的效率。即使限于搜索角色分配,仍然存在组合性很强的角色分配,而在RMTDP中评估每个角色分配以找出最佳的是非常困难的。我们的分解技术利用BDI团队计划中的结构来大大减少角色分配的搜索空间。我们的第三个关键贡献是一种更快速的策略评估算法,适用于我们的BDI-POMDP混合方法。最后,我们还呈现了两个领域的实验结果:任务演练模拟和RoboCupRescue灾害救援模拟。
作者:R. Nair, M. Tambe
论文ID:1109.2132
分类:Multiagent Systems
分类简称:cs.MA
提交时间:2011-09-13