图形处理器上的指数积分器

摘要:在这篇论文中,我们重新研究了在指数积分方法中使用图形处理器(GPU)的笔刷方法。我们进一步讨论了在同一上下文中的边界条件,并显示如果直接实现到CUDA内核中,简单的边界条件(例如,齐次Dirichlet边界条件或齐次Neumann边界条件)不会影响性能。此外,我们还展示了具有位置相关系数的笔刷方法也可以高效实现。 作为应用,我们讨论了在单个和多个GPU设置(最多4个GPU)中应用指数积分器解决不同类型问题的实现。我们进一步展示了对于基于笔刷的方法,这样的并行化可以非常高效地完成,而对于某些非结构化矩阵,多个GPU的并行化受到PCIe总线吞吐量的严重限制。

作者:Lukas Einkemmer and Alexander Ostermann

论文ID:1309.4616

分类:Numerical Analysis

分类简称:cs.NA

提交时间:2014-05-27

PDF 下载: 英文版 中文版pdf翻译中