密集线性代数的性能建模与预测
摘要:稠密线性代数算法的基于测量的性能建模和预测技术的引入。作为核心原则,这些技术完全避免了执行这些算法,而是通过对底层计算内核的运行时估计来预测它们的性能。对于各种操作,这些预测能够快速选择可用的最快算法配置。我们考虑了两种涵盖广泛计算范围的场景:为预测分块算法的性能,我们设计了算法独立的性能模型,用于自动生成一次每个平台的内核操作。对于各种矩阵操作,基于此类模型的瞬时预测既能准确地识别最快的算法,又能选择接近最优的块大小。对于基于BLAS的张量缩并的性能预测,我们提出了适应高度规则结构的缓存感知微基准测试。仅占缩并运行时间的一小部分,基于这种微基准测试的预测可以识别出张量遍历和计算内核的最快组合。
作者:Elmar Peise (HPAC, RWTH Aachen)
论文ID:1706.01341
分类:Performance
分类简称:cs.PF
提交时间:2017-06-06