摘要:基于BLIS实现的高性能卷积算法,不使用中间内存,提高了性能和可移植性
作者:Pablo San Juan, Adri''an Castell''o, Manuel F. Dolz, Pedro Alonso-Jord''a, Enrique S. Quintana-Ort''i
论文ID:2005.06410
分类:Performance
分类简称:cs.PF
提交时间:2020-05-14
PDF 下载: 英文版 中文版pdf翻译中