学习队列中未知服务速率:一种多臂赌博机方法

摘要:多服务器队列系统的考虑。作业随时间到达并进入等待服务的队列;目标是最小化队列的大小。在每次服务机会中,最多可以选择一个服务器,并且最多可以服务一个作业。服务成功的概率(服务概率)对于每个服务器是事先未知的。一个知道服务概率的算法("魔法师")总是可以选择服务概率最高的服务器。我们研究学习未知服务概率的算法。我们的目标是最小化队列遗憾:算法所得到的队列长度与"魔法师"所得到的队列长度之间的期望差异。 由于队列遗憾不能超过经典遗憾,标准多臂赌博问题的结果提供了算法,使得队列遗憾在时间上增长不超过对数。我们的论文展示了意外地更复杂的行为。特别地,只要赌博算法的队列具有相对较长的再生周期,队列遗憾与累积遗憾类似,并且(实质上)按对数缩放。然而,我们展示了这种队列赌博的"早期阶段"最终会变为"后期阶段",在这个阶段,最优的队列遗憾缩放为$O(1/t)$。我们展示了一个在后期阶段(次序上)实现这种渐近队列遗憾的算法。我们的结果在一个更一般的模型中进行了拓展,允许存在多种作业类别。

作者:Subhashini Krishnasamy, Rajat Sen, Ramesh Johari and Sanjay Shakkottai

论文ID:1604.06377

分类:Systems and Control

分类简称:cs.SY

提交时间:2019-11-25

PDF 下载: 英文版 中文版pdf翻译中