Kerncraft:用于循环内核分析性能建模的工具
摘要:实现最佳程序性能需要对硬件和软件之间的相互作用有深入的了解。对于没有深入计算机体系结构背景的软件开发人员来说,理解和充分利用现代架构几乎是不可能的。分析性循环性能建模是一种基于简单机器模型理解代码执行相关瓶颈的有用方法。屋顶线模型和执行-缓存-内存(ECM)模型是性能建模循环嵌套的成熟方法。与屋顶线模型相比,ECM模型还可以描述多核芯片上的单核性能和饱和行为。我们介绍了屋顶线和ECM模型,以及使用层条件(LC)进行模板性能建模。然后,我们介绍了Kerncraft,这是一个可以通过执行所需的代码、数据传输和LC分析自动构建屋顶线和ECM模型的工具。层条件分析可以预测循环嵌套的最佳空间阻塞因子。结合模型,它使得循环阻塞优化和有用块大小的潜在收益可以从头开始估计。在LC分析不容易的情况下,Kerncraft使用缓存模拟器作为备选方案。使用一个25点长程模板,我们展示了Kerncraft工具的有用性和预测能力。
作者:Julian Hammer, Jan Eitzinger, Georg Hager, Gerhard Wellein
论文ID:1702.04653
分类:Performance
分类简称:cs.PF
提交时间:2018-07-09