BOPS,而不是FLOPS!一种新的指标和数据中心计算的Roofline性能模型。
摘要:DC负载的上限性能评估和提供一致性比较是重要问题。为此,建立统一的以计算为中心的度量标准是必要的。FLOPS作为最重要的以计算为中心的性能指标,多年来指导计算系统的发展。然而,我们的观察表明,DC负载的平均FLOPS效率仅为0.1%,这意味着FLOPS不适用于DC计算。为了解决这个问题,我们提出了BOPS(每秒基本操作次数),它是每秒完成的基本操作(BOPs)的平均数量。我们对17个典型的DC负载的特征进行了分析,并提取出最小的代表性计算操作集,其中包括算术、比较和数组寻址的整数和浮点数计算操作。然后,我们提出了形式化的BOPS定义和基于BOPS的上限性能模型。最后,还实现了BOPS测量工具。我们在三个典型的Intel处理器平台上对17个DC负载进行了实验。首先,BOPS可以反映不同计算系统之间的性能差异,峰值BOPS性能差和平均DC负载的墙钟时间差的偏差不超过10%。其次,在实验平台上,Sort负载可以达到32%的BOPS效率。最后,我们提出了两个BOPS的应用案例。一个是基于BOPS的系统评估,我们说明BOPS可以比较来自多个领域的负载性能。另一个是基于BOPS的优化。我们展示,在基于BOPS的上限模型的指导下,Sort负载和Redis负载分别实现了4.4倍和1.2倍的性能提升。
作者:Lei Wang, Jianfeng Zhan, Wanling Gao, KaiYong Yang, ZiHan Jiang, Rui Ren, Xiwen He, Chunjie Luo
论文ID:1801.09212
分类:Performance
分类简称:cs.PF
提交时间:2019-11-11