使用莫顿索引和AVX2向量化的p4est软件库内AMR算法的备选象限表示

摘要:使用p4est软件的技术增强方案,针对并行自适应网格细化进行了改进。在p4est中,原语以三维八叉树和二维四叉树的形式存储。尽管传统上可以使用本机方法来对其进行编码,使用空间和细化级别的方式,但也可以使用其他数学等价的编码方法。 意识到这一点后,我们在经典的显式版本上添加了两种可选表示,分别基于长单调索引和128位AVX四重整数。第一种方法需要对底层四叉树操纵算法进行逻辑修改,而第二种方法利用数据级并行性,需要将算法调整为SIMD指令。所得到的算法和数据结构在性能上比标准基线有所提高,并且内存使用更少。 我们在集群上对选定的算法进行基准测试,该集群每个节点配备两个Intel(R) Xeon(R) Gold 6130 Skylake系列的CPU,支持AVX2扩展,每个节点拥有192 GB的RAM,总共可达到512个计算核心。

作者:Mikhail Kirilin (1), Carsten Burstedde (1) ((1) INS, Rheinische Friedrich-Wilhelms-Universit"at Bonn, Bonn, Germany)

论文ID:2308.13615

分类:Mathematical Software

分类简称:cs.MS

提交时间:2023-08-29

PDF 下载: 英文版 中文版pdf翻译中