多核架构上用于一阶近似的有限元数值积分

摘要:有关有限元数值积分算法在科学计算中常用的三种处理器架构(经典CPU、Intel Xeon Phi和NVIDIA Kepler GPU)的实施和性能的研究。针对所有架构考虑了统一的编程模型和可移植的OpenCL实现。该算法由于解决的不同问题和不同的元素类型而产生了各种变化,通过几个优化目标和算法到计算机架构的映射进行了验证。为不同处理器开发了执行性能模型,并在实际实验中进行了测试。结果表明,不同架构的性能水平各不相同,但说明该算法可以有效地移植到所有架构上。总的结论是,有限元数值积分在不同的多核和众核架构上可以实现足够的性能,并且不应成为有限元模拟代码的性能瓶颈。具体观察结果为如何优化内核提供了实用建议,并给出了对测试架构的预期性能。

作者:Krzysztof Bana''s, Filip Kru.zel, Jan Biela''nski

论文ID:1504.01023

分类:Mathematical Software

分类简称:cs.MS

提交时间:2016-05-25

PDF 下载: 英文版 中文版pdf翻译中