低同步GMRES算法

摘要:通信避免和流水线化的Krylov求解器的变种对于未来的超级计算机架构上的线性系统求解器的可扩展性至关重要。我们提出了迭代经典(CGs)和改进的Gram-Schmidt(MGS)算法的低同步变体,这些算法需要一个和两个全局归约通信步骤。低同步迭代CGs算法的推导基于Ruhe的之前工作。我们的主要贡献是在紧凑的$WY$形式的MGS中引入了一个反向归一化滞后,从而产生了一个每次迭代只需一个全局同步的${cal O}(eps)kappa(A)$稳定的GMRES算法。归约操作与计算重叠和流水线化以优化性能。通过加速在GPU上的GMRES BLAS-2操作,进一步提高了性能。

作者:Kasia Swirydowicz, Julien Langou, Shreyas Ananthan, Ulrike Yang, Stephen Thomas

论文ID:1809.05805

分类:Numerical Analysis

分类简称:cs.NA

提交时间:2018-09-18

PDF 下载: 英文版 中文版pdf翻译中