一种使用随机抽样的高效多核HSS-结构多前端求解器的多核实现
摘要:稀疏线性系统求解器的多前端变体的基础上,利用对结果稠密前端矩阵的低秩逼近来解决问题。我们使用具有低秩非对角块的分层半可分(HSS)矩阵来近似前端矩阵。在HSS矩阵构建中,我们使用了随机抽样算法和内插分解算法。将随机压缩与快速ULV HSS分解相结合,可以降低计算复杂度,相较于标准的多前端方法,在许多应用中加快速度,测试问题的加速比高达7倍。该实现通过使用具有动态运行时调度的任务并行ism在许多核心系统上实现。数值实验显示,与最先进的稀疏直接求解器相比,性能有所改进。该实现在一系列现代共享内存并行系统上实现了高性能和良好的可扩展性,包括Intel Xeon Phi(MIC)。该代码是一个名为STRUMPACK的软件包的一部分,STRUMPACK还有一个用于稠密秩结构化矩阵的分布式存储组件。
作者:Pieter Ghysels, Xiaoye S. Li, Francois-Henry Rouet, Samuel Williams, Artem Napov
论文ID:1502.07405
分类:Mathematical Software
分类简称:cs.MS
提交时间:2015-02-27