基于ARM多核处理器的高性能便携卷积运算符

摘要:基于BLIS实现的高性能卷积算法,不使用中间内存,提高了性能和可移植性

作者:Pablo San Juan, Adri''an Castell''o, Manuel F. Dolz, Pedro Alonso-Jord''a, Enrique S. Quintana-Ort''i

论文ID:2005.06410

分类:Performance

分类简称:cs.PF

提交时间:2020-05-14

PDF 下载: 英文版 中文版pdf翻译中