可压缩湍流流动的GPU加速DNS
摘要:在新兴的异构(CPU+GPU)计算平台上,本文探讨了将现有的基于CPU的高性能计算流体力学求解器HyPar转换为可压缩流模拟的策略。开发GPU增强版HyPar的科学动机是在这样的平台上以最高分辨率模拟典型的湍流流动。我们展示了通过优化内存操作和线程块,与CPU核心相比,计算密集型核心的速度提高了200倍。利用多个GPU和CUDA-aware MPI通信,我们展示了基于GPU的HyPar实现在NVIDIA Volta V100 GPU上的强弱可扩展性。我们在具有最多$1024^3$个点(53亿自由度)和多达1,024个GPU的网格上模拟了均匀各向同性湍流的衰变。我们比较了仅使用CPU和CPU+GPU进行模拟的墙时间。本文提出的结果是在Oak Ridge和Lawrence Livermore国家实验室的Summit和Lassen超级计算机上获得的。
作者:Youngdae Kim, Debojyoti Ghosh, Emil M. Constantinescu, Ramesh Balakrishnan
论文ID:2211.16718
分类:Computational Engineering, Finance, and Science
分类简称:cs.CE
提交时间:2022-12-07