BLISlab:用于优化GEMM的沙盒

摘要:使用一种称为BLISlab的练习集来展示如何在现代CPU的分层内存(多级缓存)上实现高性能的矩阵乘法运算。这些练习基于BLAS-like Library Instantiation Software(BLIS)框架的见解,并利用了模拟BLIS中实现的简化的“沙盒”。通过这样做,BLISlab成为了BLIS优化的“众包”渠道。

作者:Jianyu Huang and Robert A. van de Geijn

论文ID:1609.00076

分类:Mathematical Software

分类简称:cs.MS

提交时间:2016-09-02

PDF 下载: 英文版 中文版pdf翻译中