在大规模批处理系统中的吞吐量优化-arXiv论文预印本中文版

在大规模批处理系统中的吞吐量优化

摘要：一个数据处理系统，其中$n$个客户端生成的作业由$m$个并行服务器进行批处理。系统吞吐量严重依赖于批量大小和相应的次加性加速函数。在实践中，吞吐量优化依赖于对最佳批量大小的数值搜索，这个过程在现有商业系统中可能需要多天的时间。在本文中，我们将系统建模为一个封闭排队网络；标准的马尔可夫分析可以在$omegaleft(n^4\ right)$的时间内得到最佳吞吐量。我们的主要贡献是对系统的均值场模型，该模型适用于系统规模较大的情况。我们展示了均值场模型具有唯一的、全局吸引力的稳定点，可以在闭合形式中找到，并且可以表征系统的渐近吞吐量作为批量大小的函数。利用这个表达式，我们可以在$O(1)$的时间内找到渐近最优吞吐量。来自一个大型商业系统的数值设置显示，这个渐近最优值在实际的有限区间内是准确的。

作者：Sounak Kar, Robin Rehrmann, Arpan Mukhopadhyay, Bastian Alt, Florin Ciucu, Heinz Koeppl, Carsten Binnig and Amr Rizk

论文ID：2009.09433

分类：Performance

分类简称：cs.PF

提交时间：2020-09-22

PDF 下载： 英文版中文版pdf翻译中