弹性和非弹性作业的最佳资源分配

摘要:现代数据中心的任务是处理由各种类型作业组成的异构工作负载。这些类别的作业在到达速率、大小分布和作业可并行性方面有所不同。在可并行性方面,一些作业是弹性的,意味着它们可以在线性地跨多个服务器进行并行化。其他作业是非弹性的,意味着它们只能在单个服务器上运行。尽管作业类别可能差异很大,但它们通常被迫共享单个集群。在将集群共享给异构作业时,我们必须决定如何在每个时间点为每个作业分配服务器。在本文中,我们设计和分析了旨在最小化作业间平均响应时间的分配策略,其中作业的响应时间是作业到达时间到完成时间的时间间隔。我们在随机设置中对这个问题进行建模,其中每个作业可能是弹性的或非弹性的。作业的大小是从指数分布中抽取的,但对于系统来说是未知的。我们证明,在弹性作业平均大小大于非弹性作业的普通情况下,最优的分配策略是非弹性优先,即优先分配非弹性作业。我们通过引入新的路径样本论证得出这个结果。我们还证明,存在一些情况下,弹性优先(即优先分配弹性作业)比非弹性优先更好。然后,借助于求解高维马尔可夫链的最新技术,我们首次对弹性优先和非弹性优先都进行了平均响应时间分析。

作者:Benjamin Berg, Mor Harchol-Balter, Benjamin Moseley, Weina Wang, and Justin Whitehouse

论文ID:2005.09745

分类:Performance

分类简称:cs.PF

提交时间:2020-05-21

PDF 下载: 英文版 中文版pdf翻译中