使用GPGPU和嵌套交叉逼近的边界元矩阵近似

摘要:边界元方法的效率在很大程度上取决于设置刚度矩阵所需的时间。矩阵的远场部分可以通过快速多极方法或$mathcal{H}$-矩阵技术等压缩方案来近似。近场部分通常通过特殊的积分规则(如Sauter-Schwab技术)来近似,可以处理出现在对角线和近对角线矩阵元中的奇异积分。 由于计算矩阵的一个元素只需要少量的数据但需要较多的操作,我们建议使用通用图形处理单元(GPGPU)来处理可向量化的计算部分:近场计算非常适合向量化,因此可以通过GPGPU很好地处理。现代的远场压缩方案可以分为一个小的自适应部分,它表现出发散的控制流,因此应由CPU处理,以及一个可向量化的部分,可以再次发送到GPGPU。 我们提出了一种混合算法,将计算分为CPU和GPGPU的任务。当使用两个消费级GPGPU与四核CPU相比时,我们在本文中提出的方法能够将边界积分算子的设置时间降低了19-30个数量级,适用于Laplace方程和Helmholtz方程在3D中的情况。

作者:Steffen B"orm and Sven Christophersen

论文ID:1510.07244

分类:Mathematical Software

分类简称:cs.MS

提交时间:2017-10-19

PDF 下载: 英文版 中文版pdf翻译中