OMI4papps: 高度并行应用的优化、建模与实现

摘要:KONWIHR-II项目OMI4papps在德国莱布尼兹超级计算中心(LRZ)的首次结果报告。第一部分介绍了Apex-MAP,这是一个可调的合成基准,旨在模拟典型科学应用的性能。Apex-MAP模拟了常见的内存访问模式和科学代码的不同计算强度。给出了对LRZ应用程序组合建模的方法,该方法利用了在基于9728个Intel Montecito双核的SGI Altix系统“HLRB II”上运行的真实应用程序的性能计数器测量。 第二部分将展示Apex-MAP基准如何用于模拟科学应用中经常使用的两个数学内核的性能:密集矩阵乘法和稀疏矩阵向量乘法。这两个内核的性能已在x86核心和硬件加速器上进行了深入研究。我们将比较预测的性能与测量数据以验证我们的Apex-MAP方法。

作者:Volker Weinberg, Matthias Brehm, Iris Christadler

论文ID:1001.1860

分类:Performance

分类简称:cs.PF

提交时间:2010-02-01

PDF 下载: 英文版 中文版pdf翻译中