收集和展示可重复的节点内图案性能:INSPECT

摘要:内存循环算法在高性能计算研究中已经引起了相当大的关注。处理多核心的内存循环性能建模和工程问题的方法包括基本运行时测量、复杂的性能模型、详细的硬件计数器分析和彻底的扩展行为评估。由于方法的多样性和内存循环模式的多样性,我们致力于开发一种通用的方法论,用于可重复测量,并结合最先进的性能模型。我们的开源工具链和收集到的结果已在"Intranode Stencil Performance Evaluation Collection"(INSPECT)中公开可用。我们介绍了收集和记录典型内存循环模式的性能行为的潜在方法、模型和工具,涵盖了多个架构和硬件配置选项。我们的目标是为性能感知应用程序开发人员提供可重复的基准性能数据和经过验证的模型,以启动一个明确定义的性能评估和优化过程。

作者:Julian Hornich, Julian Hammer, Georg Hager, Thomas Gruber, Gerhard Wellein

论文ID:1906.08138

分类:Performance

分类简称:cs.PF

提交时间:2020-06-25

PDF 下载: 英文版 中文版pdf翻译中