数据驱动的快速多极子方法执行

摘要:快速多极方法在下一代超级计算机上具有O(N)的复杂度、计算密集型和需要非常少的同步,这使得它们成为受欢迎的算法。它们最常用于加速N体问题,但也可以用于求解边界积分方程。当粒子分布不规则且树结构是自适应的时候,负载平衡成为一个非常复杂的问题。负载平衡FMM的常见策略是使用前一步的工作负载作为权重来静态重新划分下一步。本文讨论了另一种基于数据驱动的执行方法来高效解决这个具有挑战性的负载平衡问题。核心思想是将FMM的耗时阶段分解为较小的任务。算法可以被表示为有向无环图(DAG),其中节点表示任务,边表示它们之间的依赖关系。算法的执行是通过使用QUARK运行时环境异步调度任务来完成的,以确保数值正确性而不违反数据依赖性。这种异步调度导致无序执行。数据驱动的FMM执行的性能结果优于以前的策略,并在四路插槽四核英特尔Xeon系统上显示出线性加速。

作者:Hatem Ltaief and Rio Yokota

论文ID:1203.0889

分类:Numerical Analysis

分类简称:cs.NA

提交时间:2012-03-06

PDF 下载: 英文版 中文版pdf翻译中