混合精度下对称矩阵的迭代对角化
摘要:大矩阵的对角化是许多应用中的计算瓶颈,例如电子结构计算。我们展示了通过利用32位浮点运算,同时保持64位精度,可以实现超过30%的加速。此外,我们的实现中大部分计算密集型操作都是由BLAS / LAPACK级3例程执行的,从而在大多数平台上实现最佳性能。通过使用考虑非对角元素的问题特定预处理器,可以进一步改善性能。
作者:Eiji Tsuchida and Yoong-Kee Choe
论文ID:1108.4509
分类:Computational Physics
分类简称:physics.comp-ph
提交时间:2011-08-24