并行稀疏矩阵向量乘法作为混合MPI+OpenMP编程的测试案例
摘要:优化的并行稀疏矩阵-向量操作对广泛的基于多核的集群配置中的两个代表性应用领域进行评估。首先,分析和模拟单插槽基准性能,针对标准多核芯片的基本体系结构特性。超越单节点,并行稀疏矩阵-向量操作经常在通信与计算之间存在不利的比例。我们观察到非阻塞MPI在使用标准MPI实现时无法隐藏通信成本,因此我们证明可以通过使用专用通信线程(可以在虚拟核心上运行)来实现通信和计算的显式重叠。我们将我们的方法与纯MPI和广泛使用的“向量式”混合编程策略进行比较。
作者:Gerald Schubert, Georg Hager, Holger Fehske, Gerhard Wellein
论文ID:1101.0091
分类:Performance
分类简称:cs.PF
提交时间:2012-03-01