智能和连接社区中的动态资源分配的层级规划-arXiv论文预印本中文版

智能和连接社区中的动态资源分配的层级规划

摘要：资源分配存在不确定性是城市规模的城市物理系统中的一个经典问题。以应急响应为例，城市规划师和急救人员优化救护车的位置，以最小化预期的对事故（如道路事故）的响应时间。通常，这些问题涉及到在不确定性下的顺序决策，并且可以建模为马尔可夫（或半马尔可夫）决策过程。决策者的目标是学习一个从状态到行动的映射，以最大化预期奖励。虽然在线、离线和分散的方法已经被提出来解决这些问题，但在实际应用中可扩展性仍然是一个挑战。我们提出了一种利用城市级城市物理系统问题中的结构进行资源分配的层次规划的通用方法。我们以应急响应为案例研究，展示了如何将一个大型资源分配问题划分为较小的问题。然后，我们使用蒙特卡罗规划来解决这些较小的问题，并管理它们之间的交互作用。最后，我们使用美国田纳西州的纳什维尔的数据来验证我们的方法。我们的实验表明，所提出的方法在应急响应领域中超过了现有技术方法。

作者：Geoffrey Pettet, Ayan Mukhopadhyay, Mykel J. Kochenderfer, and Abhishek Dubey

论文ID：2107.01292

分类：Multiagent Systems

分类简称：cs.MA

提交时间：2021-12-22

PDF 下载： 英文版中文版pdf翻译中