在并行计算架构上计算排位显现UTV分解的高效算法

摘要:随机奇异值分解(RSVD)现在已经成为一种有效计算矩阵近似奇异值分解的成熟技术。基于RSVD所基础的思想,最近提出的算法"randUTV"计算给定矩阵的完整因式分解,提供接近最优误差的低秩近似。因为randUTV的主要部分是基于通信效率高的操作,例如矩阵乘法和未经转置的QR因式分解,所以在大多数高性能计算环境中,它比竞争的列转置QR等透露秩方法更快。在本文中,我们提出了针对共享内存和分布式内存计算环境的优化randUTV实现。对于共享内存,randUTV采用了一种“按块的算法”,结合运行时任务调度器,消除了数据同步点的瓶颈,从而在标准的基于纯分支-合并方法的“块算法”上实现加速。分布式内存的实现基于ScaLAPACK库。我们的新代码在共享内存和分布式内存架构上与竞争的因式分解方法相比,性能表现得更好。

作者:N. Heavner, F. D. Igual, G. Quintana-Ort''i, P.G. Martinsson

论文ID:2104.05782

分类:Mathematical Software

分类简称:cs.MS

提交时间:2021-04-14

PDF 下载: 英文版 中文版pdf翻译中