一种用于分层体系结构的高效OpenMP运行时系统
摘要:充分利用始终更深层次的层次化多处理器机器的计算能力需要在底层的非统一体系结构中非常谨慎地分配线程和数据。多核芯片和NUMA机器的出现使得最小化远程内存访问的数量,促进缓存关联,并确保快速完成同步步骤变得重要。通过使用BubbleSched平台作为GOMP OpenMP编译器的线程后端,我们能够轻松地将线程团队的关联转换为使用称为bubbles的抽象的调度提示。然后,我们提出了一种适用于嵌套OpenMP并行性的调度策略。结果初步的性能评估显示了在典型的NAS OpenMP基准应用程序上加速的显着改进。
作者:Samuel Thibault (INRIA Futurs), Franc{c}ois Broquedis (INRIA Futurs), Brice Goglin (INRIA Futurs), Raymond Namyst (INRIA Futurs), Pierre-Andr''e Wacrenier (INRIA Futurs)
论文ID:0706.2073
分类:Programming Languages
分类简称:cs.PL
提交时间:2007-06-15