利用MLIR进行循环矢量化和FFT库的GPU移植
摘要:FFTc:一种用于设计和生成快速傅里叶变换(FFT)库的领域特定语言(DSL)。FFTc的独特之处在于利用和扩展了多级中间表示(MLIR)方言以优化FFT代码生成。在本文中,我们介绍了FFTc的扩展和改进,如使用不同的数据布局以适应复值数组,以及稀疏化以实现高效的向量化和无缝移植FFT库到GPU系统。我们展示了在CPU上,通过向量化,FFTc生成的FFT的性能与FFTW(一种先进的FFT库)的性能相当。我们还展示了FFTc在Nvidia GPU上的初步性能结果。
作者:Yifei He and Artur Podobas and Stefano Markidis
论文ID:2308.00497
分类:Mathematical Software
分类简称:cs.MS
提交时间:2023-08-02