QMCPACK蒙特卡洛代码中的分层并行性高性能设计

摘要:QMCPACK的高性能设计,用于量子蒙特卡罗代码中的并行性的引入。与之前的GPU实现相比,我们证明了新设计更能够利用异构架构的分层并行性。新版本通过Monte Carlo行走者群体的新概念以及使更多主机CPU线程能够有效地卸载到GPU中,实现了更高的GPU占用率。预计这种更高的性能将独立于底层硬件的控制,并显著提高开发人员的生产力和降低代码维护成本。在GPU实现不可用或CPU执行更为优化时,通过完全支持回退到CPU执行,还提高了科学生产力。

作者:Ye Luo, Peter Doak and Paul Kent

论文ID:2209.14487

分类:Computational Physics

分类简称:physics.comp-ph

提交时间:2023-04-19

PDF 下载: 英文版 中文版pdf翻译中