大规模GPU装备的超级计算机上的半拉格朗日4D、5D和6D动力学等离子体模拟

摘要:在使用基于网格的求解器进行运行动力学等离子体物理仿真时,对内存和计算成本的要求都非常高。这主要是由于多达六维的相空间以及与网格间距的计算成本的不利比例(通常被称为维度诅咒)所导致的。在本文中,我们使用基于图形处理器(GPU)的分裂步长半拉格朗日间断Galerkin方案,对Vlasov-Poisson方程进行了4D、5D和6D的仿真。该方法的本地通信模式使其能够在大规模GPU系统上实现高效率的实现,强调了同时考虑算法和高性能计算方面的重要性。我们展示了单节点性能超过2TB/s的有效内存带宽(在一个装有4个A100 GPU的节点上)并且在JUWELS Booster的1536个A100 GPU上展示了出色的扩展性(并行效率在30%到67%之间)。

作者:Lukas Einkemmer and Alexander Moriggl

论文ID:2110.14557

分类:Computational Physics

分类简称:physics.comp-ph

提交时间:2021-10-28

PDF 下载: 英文版 中文版pdf翻译中