在异构CPU-GPU体系结构上具有几何精确的颗粒的高效可扩展混合流-颗粒模拟
摘要:多物理场模拟中,使用图形处理器单元(GPU)加速数值模拟越来越受欢迎。各种组合方法具有不同的计算特征,因此最适合的硬件架构可能在模拟组件之间有所不同。而且,并不是所有的耦合软件框架都支持所有的硬件。这些问题预先决定或甚至迫使混合实现,即在不同的硬件上运行不同的模拟组件。我们介绍了一种使用几何粒子的混合流体-颗粒耦合实现。该模拟将GPU用于流体动力学,而颗粒模拟则在中央处理器(CPU)上运行。我们在异构超级计算机上对流化床模拟的两种对比案例进行了性能测试。混合开销(即CPU-GPU通信)可以忽略不计。流体模拟利用了几乎全部的内存带宽,性能良好。然而,GPU运行时间占据了总时间的大部分。在1024个A100 GPU的弱扩展基准测试中,并行效率高达71\%。颗粒模拟中频繁发生的CPU-CPU通信是降低并行效率的主要原因。结果表明,在异构超级计算机上,混合实现对于大规模多物理场模拟是有前景的。
作者:Samuel Kemmler, Christoph Rettinger, Harald K"ostler
论文ID:2303.11811
分类:Computational Engineering, Finance, and Science
分类简称:cs.CE
提交时间:2023-03-22