CUDA和CUDA-Aware版本的OpenMPI在多GPU环境下实现基于时间显式有限体积求解器的浅水方程。

摘要:多GPU版本的时显有限体积求解器对多GPU架构的浅水方程进行了开发。将MPI与CUDA-Fortran结合使用,以使用所需数量的GPU。利用METIS库对感兴趣的二维非结构化三角形网格进行域分解。采用CUDA-Aware OpenMPI版本加快MPI进程之间的消息传递。进行了速度提升和效率的研究;首先在一个经典的运河中进行溃坝流动的研究,然后在两个具有复杂水深的实际区域进行研究:Mille Iles河和蒙特利尔群岛。在这两种情况下,使用高达1300万单元的网格。在这些网格上使用24至28个GPU可以实现80\%以上的效率。最后,将多GPU版本与纯MPI多CPU版本进行比较,并得出结论:在这种特殊情况下,需要约100个CPU核心才能实现与一个GPU相同的性能。

作者:Vincent Delmas, Azzedine Soula"imani

论文ID:2010.14416

分类:Computational Physics

分类简称:physics.comp-ph

提交时间:2023-03-03

PDF 下载: 英文版 中文版pdf翻译中