在现代GPU集群上,利用曲线坐标下的高阶有限差分方法加速CFD模拟

摘要:复杂几何结构下高雷诺数流动的高保真度流动模拟仍然非常具有挑战性,这需要更强大的HPC系统的计算能力。然而,传统CPU架构的HPC发展受到功耗高和技术难题的制约。异构计算架构被提出作为HPC发展困难的有希望解决方案。GPU加速技术已经被应用于结构化网格低阶格式CFD求解器和非结构网格高阶格式求解器。结构化网格上的高阶有限差分方法具有很多优点,如高效率、稳健性和低存储量,然而,高阶有限差分格式中点之间的强依赖性仍限制了其在GPU平台上的应用。在本研究中,我们提出了一套硬件感知技术,优化CPU和GPU之间的数据传输效率,以及GPU之间的通信效率。将一个高阶有限差分方法在曲线坐标上的多块结构化CFD求解器移植到GPU平台,得到了令人满意的性能,最高速度提升约2000倍。本工作在当前GPU异构计算机上为将GPU计算应用于带有特定高阶有限差分方法的CFD模拟提供了高效解决方案。测试表明,在不同的GPU上可以实现显著的加速效果。

作者:Chuangchao Ye, Pengjunyi Zhang, Rui Yan, Dejun Sun and Zhenhua Wan

论文ID:2006.07964

分类:Computational Physics

分类简称:physics.comp-ph

提交时间:2022-03-03

PDF 下载: 英文版 中文版pdf翻译中