级联GEMM:从低精度到高精度
摘要:从低精度高性能矩阵乘法(GEMM)的角度,本文提出了实施更高精度矩阵乘法的见解和机会。驱动案例研究以双精度(FP64)GEMM为基础,近似双精度(FP64x2)GEMM,利用BLAS-like Library Instantiation Software(BLIS)框架对Goto算法进行了重构。通过这种方式,展示了如何将近似的FP64x2 GEMM准确性转化为十个“级联”FP64 GEMM。报告了初步性能和准确性实验的有希望的结果。所展示的技术为在GEMM类似功能中以低精度计算为基础的更一般的级联高精度计算打开了新的研究方向。
作者:Devangi N. Parikh, Robert A. van de Geijn, Greg M. Henry
论文ID:2303.04353
分类:Mathematical Software
分类简称:cs.MS
提交时间:2023-03-09