使用STREAM基准测试测量NUMA效应

摘要:现代高端机器具有多个处理器封装,每个封装包含多个独立的核心和集成的内存控制器,直接连接到专用物理内存。这些封装通过共享总线连接,创建了一个具有异构内存层次结构的系统。由于这个共享总线的带宽比连接到内存的链接总和小,当并行线程都访问与其处理器封装本地连接的内存时,聚合内存带宽更高,而访问与远程封装连接的内存时则较低。然而,这种异构内存架构的影响很难从供应商的基准测试中理解。即使这些数据可用,它们也只提供最佳情况下的内存吞吐量。本研究对著名的STREAM基准进行了一系列修改,以测量NUMA对48核AMD Opteron机器和32核Intel Xeon机器的影响。

作者:Lars Bergstrom

论文ID:1103.3225

分类:Performance

分类简称:cs.PF

提交时间:2015-03-19

PDF 下载: 英文版 中文版pdf翻译中