QMCPACK蒙特卡洛代码中的分层并行性高性能设计
摘要:QMCPACK的高性能设计,用于量子蒙特卡罗代码中的并行性的引入。与之前的GPU实现相比,我们证明了新设计更能够利用异构架构的分层并行性。新版本通过Monte Carlo行走者群体的新概念以及使更多主机CPU线程能够有效地卸载到GPU中,实现了更高的GPU占用率。预计这种更高的性能将独立于底层硬件的控制,并显著提高开发人员的生产力和降低代码维护成本。在GPU实现不可用或CPU执行更为优化时,通过完全支持回退到CPU执行,还提高了科学生产力。
作者:Ye Luo, Peter Doak and Paul Kent
论文ID:2209.14487
分类:Computational Physics
分类简称:physics.comp-ph
提交时间:2023-04-19