新兴众核架构上的稀疏矩阵-向量乘法优化

摘要:为科学和高性能应用程序中最常见的操作之一的稀疏矩阵-向量乘法(SpMV)提供了第一份关于稀疏矩阵表示对于两种新兴众核架构(Intel的Knights Landing (KNL) XeonPhi和基于ARM的FT-2000Plus (FTP))的影响的全面研究。我们的大规模实验涉及956个稀疏数据集和五种主流SpMV表示的超过9,500次个别剖析运行。我们表明,最佳的稀疏矩阵表示取决于底层架构和程序输入。为了帮助开发人员选择最佳的矩阵表示,我们使用机器学习来开发一个预测模型。我们的模型首先使用一组训练示例进行离线训练。学习过的模型可以用来预测给定架构下任何未见输入的最佳矩阵表示。我们表明,我们的模型在KNL和FTP上平均达到了95%和91%的最佳性能,并且在运行时无需剖析开销。

作者:Shizhao Chen, Jianbin Fang, Donglin Chen, Chuanfu Xu, Zheng Wang

论文ID:1805.11938

分类:Mathematical Software

分类简称:cs.MS

提交时间:2018-05-31

PDF 下载: 英文版 中文版pdf翻译中