优化IBM Blue Gene/P PowerPC 450处理器上流式数值内核的性能

摘要:在这篇论文中,我们提出了一种使用高级汇编合成和优化框架构建流式数值核的新方法。我们在Python中实现了这种方法,以针对IBM Blue Gene/P超级计算机的PowerPC 450核心进行优化。本文详细描述了利用CPU指令集子集设计、构建、模拟、验证和分析这些核的高级设计。我们通过在各种缓存内存场景下实现几个三维模板核,并分析机械调度的变体来证明我们方法的有效性。其中包括一个27点模板核,实现了比以前发表的最佳结果快1.7倍的加速比。

作者:Tareq M. Malas, Aron J. Ahmadia, Jed Brown, John A. Gunnels, David E. Keyes

论文ID:1201.3496

分类:Performance

分类简称:cs.PF

提交时间:2015-10-19

PDF 下载: 英文版 中文版pdf翻译中