高性能直接重力N体模拟在图形处理器上

摘要:用商用图形处理单元(GPU)NVIDIA Quadro FX1400和GeForce 8800GTX进行引力直接N体模拟,与GRAPE-6Af专用硬件的结果进行比较。通过使用GPU直接加速计算,我们实现了N体问题的力评估。方程运动的积分在主机计算机上使用C实现,采用4阶预测-校正Hermite积分器和块时间步长。我们发现,对于大量粒子(N大于等于10^4),现代图形处理单元提供了一种低成本的替代方法,与GRAPE专用硬件相比。现代GPU的粒子数量与性能的变化相对较小,与GRAPE相当。使用相同的时间步长标准,GPU上的N体系统总能量的保持比1/10^6稍差,只比GRAPE差一个数量级。对于N大于等于10^6,GeForce 8800GTX比主机计算机快约20倍。虽然速度仍比GRAPE慢一个数量级,但现代GPU在成本低、平均故障时间长和更大的内置存储器方面优于GRAPE;GRAPE-6Af最多只能容纳256k个粒子,而GeForce 8800GTF可以在内存中容纳900万个粒子。

作者:Simon Portegies Zwart, Robert Belleman, Peter Geldof

论文ID:cs/0702135

分类:Performance

分类简称:cs.PF

提交时间:2015-06-25

PDF 下载: 英文版 中文版pdf翻译中