高性能共轭梯度基于GraphBLAS的有效实现
摘要:图算规范在高性能计算 (HPC) 环境中的应用面临着日益复杂的挑战。其中,稀疏数据的增加使用推动了数据结构和编程模型的极限,并阻碍了现有高并行硬件的高效使用。图算规范通过提出一组数据容器和原语,并基于抽象代数概念的语义,解决了这些挑战:这使得可以用一小组原语来描述稀疏数据上的多个应用程序,并受益于编译时已知的代数规范的许多优化。在HPC应用程序中,高性能共轭梯度 (HPCG) 基准是一种重要的稀疏工作负载的代表,其结构提出了几个可编程性和性能方面的挑战。本工作通过在GraphBLAS上提出和评估HPCG的实现,突出其核心的主要变化,来解决这些挑战。共享内存系统的结果优于参考结果,而分布式系统的结果突出了符合GraphBLAS规范的实现的基本限制,这提示了几个未来的方向。
作者:Alberto Scolari, Albert-Jan Yzelman
论文ID:2304.08232
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-04-18