利用MLIR进行循环矢量化和FFT库的GPU移植

摘要:FFTc:一种用于设计和生成快速傅里叶变换(FFT)库的领域特定语言(DSL)。FFTc的独特之处在于利用和扩展了多级中间表示(MLIR)方言以优化FFT代码生成。在本文中,我们介绍了FFTc的扩展和改进,如使用不同的数据布局以适应复值数组,以及稀疏化以实现高效的向量化和无缝移植FFT库到GPU系统。我们展示了在CPU上,通过向量化,FFTc生成的FFT的性能与FFTW(一种先进的FFT库)的性能相当。我们还展示了FFTc在Nvidia GPU上的初步性能结果。

作者:Yifei He and Artur Podobas and Stefano Markidis

论文ID:2308.00497

分类:Mathematical Software

分类简称:cs.MS

提交时间:2023-08-02

PDF 下载: 英文版 中文版pdf翻译中