使用Kerncraft进行自动循环内核分析和性能建模
摘要:基于Kerncraft工具的分析性能模型构建在理解循环内核性能特征方面具有重要意义,循环内核在计算科学中占据了CPU周期的主要部分。基于经过验证的性能模型,可以推断出相关硬件瓶颈和有希望的优化机会。然而,即使对于有经验的开发人员来说,分析性能建模通常也是繁琐的,因为它需要对硬件以及硬件与软件的交互有深入的了解。我们介绍了“Kerncraft”工具,它可以简化流式内核和stencil循环嵌套的分析性能模型的构建。从循环源代码、问题规模和底层硬件的描述出发,Kerncraft可以基于Roofline模型或Execution-Cache-Memory(ECM)模型,理想地预测多核处理器上循环的单核性能和扩展行为。我们描述了Kerncraft的工作原理、能力和限制,并展示了如何通过加速的分析建模快速获得洞见。
作者:Julian Hammer and Georg Hager and Jan Eitzinger and Gerhard Wellein
论文ID:1509.03778
分类:Performance
分类简称:cs.PF
提交时间:2015-11-06