用bfloat16在NVIDIA GPU上发现异类脉冲星
摘要:减少数值精度对GPU加速FDAS管道的灵敏度影响的量化研究 利用傅立叶域加速搜索(FDAS)在大型射电天文数据集中检测微弱的二进制脉冲星是一种有效的技术。本文定量评估了在AstroAccelerate软件包的GPU加速FDAS管道中减少数值精度的灵敏度影响。先前的实现在整个二进制脉冲星检测管道中使用IEEE-754单精度,其中的大部分运行时间用于计算GPU加速的FFT。AstroAccelerate已经修改,使用bfloat16(和IEEE754双精度用作“金标准”比较)在FDAS例程的傅立叶域卷积部分中。使用SIGPROC生成了大约20,000个代表二进制脉冲星的合成脉冲星滤波器文件,涵盖了一系列物理参数。它们已经使用bfloat16、单精度和双精度卷积进行处理。所有bfloat16峰值与其对应的单精度峰值的预测信噪比相差不超过3\%。在功率超过44.982(我们实验测得的最高噪声值)的14,971个“亮”单精度基频峰值中,有14,602个(97.53\%)在bfloat16输出平面的同一加速度和频率格中有峰值,而在其余的369个中,最近的峰值位于相邻的加速度格中。在单精度和双精度结果之间没有测量到任何格漂移。FDAS的bfloat16版本相对于单精度实现了大约1.6倍的加速。使用通过GMRT观测收集的PSR J1544+4937的数据,对AstroAccelerate和PRESTO软件包进行了比较,PSR J1544+4937是一个2.16毫秒的黑寡妇脉冲星,其轨道周期为2.8小时。
作者:Jack White, Karel Adamek, Jayanta Roy, Sofia Dimoudi, Scott M. Ransom, Wesley Armour
论文ID:2206.12205
分类:Instrumentation and Methods for Astrophysics
分类简称:astro-ph.IM
提交时间:2023-03-01