BLASFEO:嵌入式优化的基本线性代数子程序
摘要:BLASFEO:一种稠密线性代数库,提供高性能实现的BLAS和LAPACK类似例程,用于嵌入式优化。与现有的高性能BLAS实现相比,关键区别在于计算性能针对小到中等规模的矩阵进行优化,即大小不超过几百个。BLASFEO有三种不同的实现:一个高性能实现,旨在为适合缓存中的矩阵提供最高性能,一个引用实现,提供可移植性和可嵌入性,优化用于非常小的矩阵,以及一个封装到标准BLAS和LAPACK的包装器,为大矩阵提供高性能。 BLASFEO的三种实现一起为从非常小到大的矩阵提供高性能密集线性代数例程。与开源和专有的经过高度调优的BLAS库相比,对于大小约为一百的矩阵,BLASFEO的高性能实现比对应的级别3 BLAS例程快20-30%,比对应的LAPACK例程快2-3倍。
作者:Gianluca Frison, Dimitris Kouzoupis, Tommaso Sartor, Andrea Zanelli, Moritz Diehl
论文ID:1704.02457
分类:Mathematical Software
分类简称:cs.MS
提交时间:2020-02-05