分散式多智能体强化学习用于动态和不确定环境-arXiv论文预印本中文版

分散式多智能体强化学习用于动态和不确定环境

摘要：多智能体强化学习（MARL）是一种在分散控制问题中进行优化的广泛应用技术。然而，MARL的大多数应用都是在静态环境下的，并不适用于智能体行为和环境条件动态和不确定的情况。解决这种环境的不确定性仍然是基于MARL的系统所面临的一个具有挑战性的问题。环境的动态特性导致以前对智能体如何相互作用的了解变得过时。通过预测未来可能发生的变化的高级知识，可以有效地帮助智能体收敛到接近最优的控制解决方案。在本文中，我们提出了P-MARL，一种通过预测机制提供准确环境变化信息的分散MARL算法。该预测是通过采用结合人工神经网络和自组织映射的方法来检测和匹配环境中的变化实现的。所提出的算法在一个真实的智能电网场景中进行了验证，并为电动车充电问题提供了92%的帕累托有效解。

作者：Andrei Marinescu, Ivana Dusparic, Adam Taylor, Vinny Cahill, Siobh''an Clarke

论文ID：1409.4561

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2014-09-17

PDF 下载： 英文版中文版pdf翻译中