GEMMFIP:在BLIS中统一GEMM

摘要:统一的矩阵操作实现技术:针对小型和大型问题,实现矩阵操作(如通用矩阵乘法)的高性能方法。通过将数据重排(将数据复制到内存中的连续布局,对于大型矩阵的性能至关重要)与第一次计算“遍历”结合起来,提高了各种问题规模下的性能。因此,调整通用库变得更简单,因为无需精确表达和参数化选择“小矩阵”策略和“大矩阵”策略的逻辑。描述了使用类似BLAS的库实例化软件(BLIS)框架构建的该技术的原型实现,并报告了在各种体系结构上的性能。

作者:RuQing G. Xu and Field G. Van Zee and Robert A. van de Geijn

论文ID:2302.08417

分类:Mathematical Software

分类简称:cs.MS

提交时间:2023-02-20

PDF 下载: 英文版 中文版pdf翻译中