层次性能建模用于排名稠密线性代数算法

摘要:用于Dense线性代数运算,如LU分解或三角矩阵求逆,通常使用分块算法进行。对于这类操作,通常存在许多不同的算法变体;每个变体在计算架构、库和问题规模的不同情况下都具有不同的性能。我们提出了一种在不执行算法的情况下,根据给定场景评估算法变体性能的方法和工具。 为此,我们确定了构建算法的例程。第一个工具 - Sampler - 用于测量这些例程的性能。使用Sampler,第二个工具模拟它们的性能。然后,生成的模型用于预测所考虑算法的性能。对于给定的场景,这些预测可以让我们正确地根据性能对算法进行排序,而无需执行它们。借助相同的工具,还可以对算法参数(如块大小)进行最优调整。

作者:Elmar Peise (1) ((1) AICES, RWTH Aachen)

论文ID:1207.5217

分类:Performance

分类简称:cs.PF

提交时间:2012-08-28

PDF 下载: 英文版 中文版pdf翻译中