数据中心中数据分析工作负载的特征化

摘要:数据爆炸式增长,越来越多的公司使用数据中心进行有效决策和获取竞争优势。数据分析应用在数据中心中发挥着重要作用,因此了解其行为对于进一步提高数据中心的性能变得越来越重要。本文在调查了三个在页面点击量和日访问人数方面最重要的应用领域之后,选择了11个代表性的数据分析工作负载,并通过使用硬件性能计数器来描述它们的微架构特征,以便了解现代超标量乱序处理器设备上的数据分析工作负载对系统的影响和意义。我们对这些工作负载进行的研究发现,数据分析应用具有许多固有特征,这使它们与桌面(SPEC CPU2006)、高性能计算(HPCC)、服务工作负载(包括传统服务器工作负载SPECweb2005和云计算套件中的四个基准之一)不同,并因此为体系结构和系统优化提供了一些建议。基于我们对工作负载的特征化工作,我们发布了一个名为DCBench的基准套件,用于典型的数据中心工作负载,包括数据分析和服务工作负载,并在我们的项目主页上以开源许可证进行了发布(http://prof.ict.ac.cn/DCBench)。我们希望DCBench有助于进行数据中心计算的体系结构和中小规模系统的研究。

作者:Zhen Jia, Lei Wang, Jianfeng Zhan, Lixin Zhang, Chunjie Luo

论文ID:1307.8013

分类:Performance

分类简称:cs.PF

提交时间:2013-07-31

PDF 下载: 英文版 中文版pdf翻译中