周期性服务和维护系统的均值回报优化
摘要:确定聚会代理人的周期性访问所需的有向图节点。 代理人在节点之间移动,并根据自上次访问节点以来经过的时间收到每个完成的服务任务的报酬。 我们考虑找到代理人的合适计划的问题,以使其每个时间单位的长期平均回报最大化。 我们证明了对于每个固定的$varepsilon geq 0$,构建一个$varepsilon$-最优计划的问题是PSPACE-hard的,并且存在一个指数长度的最优周期性计划。 我们提出随机有限内存(RFM)计划作为代理人策略的紧凑描述,并设计了一个有效的算法来构建RFM计划。 此外,我们通过从RFM计划中进行抽样来构建确定性周期性计划。
作者:David Klav{s}ka and Anton''in Kuv{c}era and V''it Musil and Vojtv{e}ch v{R}eh''ak
论文ID:2305.08555
分类:Computer Science and Game Theory
分类简称:cs.GT
提交时间:2023-05-19