合作信息共享以改进多智能体系统中的分布式学习

摘要:部分可观察领域中,有效协调多智能体行动是多智能体系统研究的重要挑战之一。为了解决这个问题,许多研究者开发了技术,允许智能体基于所学习的其他智能体状态和行动的估计来做出决策,通常使用某种机器学习算法进行学习。然而,许多这些方法未能提供实际的手段,以使必要的信息可用,以便进行估计的学习。为此,我们认为智能体之间的合作通信是一种机制。然而,在动态变化的环境中,通信信息的准确性和及时性决定了所学估计的准确性和基于这些估计所采取行动的有用性。鉴于此,我们提出了一种新颖的信息共享协议,即任务完成后的信息分享,用于分发状态信息。然后,我们通过正式分析展示了使用我们的策略产生的估计质量相比于最常用的邻近智能体之间共享信息的协议的改进。此外,我们还将围绕我们的信息分享原则设计的通信启发式方法与其他基准策略(包括Littmans Q-routing和Stones TPOT-RL)进行实证评估,其中涉及模拟呼叫路由应用程序。这些研究在一系列环境设置下进行,结果显示,与使用不同基准的策略相比,我们的策略在呼叫连接率上提高了高达60\%;在连接长距离呼叫的能力上提高了超过1000\%;并且消息开销也低至0.25。

作者:P. S. Dutta, N. R. Jennings, L. Moreau

论文ID:1109.5712

分类:Multiagent Systems

分类简称:cs.MA

提交时间:2011-09-28

PDF 下载: 英文版 中文版pdf翻译中