有限差分求解器在不同计算机架构上的性能预测-arXiv论文预印本中文版

有限差分求解器在不同计算机架构上的性能预测

摘要：偏微分方程（PDE）求解器的生命周期通常由三个开发阶段来描述：稳定数值离散化的开发、正确（已验证）实现的开发以及针对不同计算机体系结构的优化。通常只有在投入了大量的时间和精力之后，才能完全理解PDE求解器的性能瓶颈，而其精确细节在不同的计算机体系结构之间也有所不同。缓解这个问题的一种方法是建立一个可靠的性能模型，允许数值分析师在着手进行可能漫长而昂贵的实现和优化阶段之前，对数值方法在给定计算机体系结构上的性能表现做出可靠预测。可靠性能模型的可用性还可以节省开发人员的工作量，因为它既告知开发人员哪种优化是有益的，又指示何时已达到最大预期性能并应停止优化工作。我们展示了如何从理论上研究波动方程的离散化，以了解该方法在现代计算机体系结构上的性能限制。我们重点介绍了在高性能计算社区广泛使用的屋顶线性模型，该模型以算法选择的内存带宽峰值和浮点性能峰值为基础考虑可实现的性能。我们提出了关键时间步进有限差分算法的操作强度的第一原理分析。有了这些信息，可以在算法设计时将目标计算机系统上的预期性能用作算法设计的驱动因素。

作者：Mathias Louboutin, Michael Lange, Felix Herrmann, Navjot Kukreja, and Gerard Gorman

论文ID：1608.03984

分类：Performance

分类简称：cs.PF

提交时间：2017-06-07

PDF 下载： 英文版中文版pdf翻译中