BLISlab:用于优化GEMM的沙盒
摘要:使用一种称为BLISlab的练习集来展示如何在现代CPU的分层内存(多级缓存)上实现高性能的矩阵乘法运算。这些练习基于BLAS-like Library Instantiation Software(BLIS)框架的见解,并利用了模拟BLIS中实现的简化的“沙盒”。通过这样做,BLISlab成为了BLIS优化的“众包”渠道。
作者:Jianyu Huang and Robert A. van de Geijn
论文ID:1609.00076
分类:Mathematical Software
分类简称:cs.MS
提交时间:2016-09-02