重负载下多服务器作业模型的最优调度
摘要:多服务器作业系统在实践中广泛存在,其中作业需要在多个服务器上并发服务。几乎所有关于多服务器作业系统的理论工作都集中在最大化利用率上,对平均响应时间知之甚少。在更简单的情况下,例如各种已知大小的单服务器作业设置中,最小化平均响应时间仅仅是优先处理小作业的问题。然而,在多服务器作业系统中,仅仅优先处理小作业是不够的,因为我们还必须确保服务器没有不必要的闲置。因此,最小化平均响应时间需要在同时最大化吞吐量的同时优先处理小作业。我们的问题是如何实现这些联合目标。 我们设计了ServerFilling-SRPT调度策略,这是第一个在重负载极限下最小化多服务器作业模型的平均响应时间的策略。除了证明这一重负载结果之外,我们还提供了实证证据表明,在所有负载情况下,ServerFilling-SRPT的性能优于所有现有的调度策略,在较高负载下的改进程度达到数量级。因为ServerFilling-SRPT需要知道作业大小,所以我们还定义了ServerFilling-Gittins策略,该策略在大小未知或部分已知的情况下是最优的。
作者:Isaac Grosof, Ziv Scully, Mor Harchol-Balter, and Alan Scheller-Wolf
论文ID:2211.02762
分类:Performance
分类简称:cs.PF
提交时间:2022-11-08