异构加速矩阵乘法:OpenCL + APU + GPU+ 快速矩阵相乘

摘要:混合处理器中开发稠密矩阵乘法代码的情况研究:使用所有计算引擎,以及可达到的顶峰性能200 GFLOPS的案例研究.

作者:Paolo D'Alberto

论文ID:1205.2927

分类:Mathematical Software

分类简称:cs.MS

提交时间:2012-05-15

PDF 下载: 英文版 中文版pdf翻译中