无矩阵有限元方法的向量化研究
摘要:有限元方法中,向量化对于在现代硬件上实现高性能至关重要,特别是利用SIMD指令。然而,在有限元方法中的矩阵和向量的组装过程中,由于需要在非结构化网格上迭代执行本地组装核,导致有效的向量化变得困难。在保持用户友好的高层接口和适度的抽象程度的同时,生成适用于有限元方法的高效向量化代码,对于数值计算软件系统和库来说是一项挑战。在本研究中,我们通过代码转换研究了在有限元框架Firedrake中进行跨元素向量化,并通过对两个最新的CPU和三个主流编译器上的不同多项式程度和离散化的广泛矩阵无关算子进行评估,展示了这种方法的有效性。我们的实验表明,我们的跨元素向量化方法对于许多实际意义的例子可以达到理论峰值性能的30%,在算术强度较高的情况下超过50%,且相对于局部组装核的(元素内)向量化具有持续的加速效果。
作者:Tianjiao Sun, Lawrence Mitchell, Kaushik Kulkarni, Andreas Kl"ockner, David A. Ham and Paul H. J. Kelly
论文ID:1903.08243
分类:Mathematical Software
分类简称:cs.MS
提交时间:2020-08-26