数据传输的性能模型:以分子化学核心为案例研究

摘要:在高性能计算中,由于硬件的复杂性不断提高,具有不同内存节点的系统随处可见。开发能够将内存节点之间的数据传输与计算重叠以充分利用这些系统的潜力是至关重要的。本文研究了在一组独立任务中决定两个内存节点之间数据传输顺序的问题,目标是最小化完成时间。我们证明,在有限的内存容量下,获得最优的数据传输顺序是一个NP完全问题。我们提出了几种启发式算法,并详细介绍了它们的有利情况。我们对运行2个分子化学核心,即Hartree-Fock(HF)和Coupled Cluster Single Double(CCSD)在HPC系统的10个节点上获得的跟踪进行了分析。我们的结果表明,一些启发式算法在中等内存容量下实现了显著的重叠,并且非常接近完成时间的下界。

作者:Suraj Kumar, Lionel Eyraud-Dubois, Sriram Krishnamoorthy

论文ID:1904.06825

分类:Performance

分类简称:cs.PF

提交时间:2019-06-12

PDF 下载: 英文版 中文版pdf翻译中