GPU机器上的扭曲质量集合生成
摘要:将Hybrid Monte Carlo实现在tmLQCD软件集合中的移植到GPU上,通过将其最昂贵的部分转移到QUDA库。我们讨论了我们的动机以及在向tmLQCD和QUDA添加所需功能时遇到的一些技术挑战。我们还介绍了一些性能细节,特别关注使用QUDA的多重网格求解器处理条件较差的轻夸克单项式以及使用多重移位求解器处理非简并奇异和魅夸克部分在$N\_f=2+1+1$扭曲质量三叶草费米子模拟中的效率,同时比较在CPU和GPU机器上进行先进模拟的效率。我们还通过对基于AMD的MI250 GPU的机器进行初步测试,来探讨性能可移植性问题,在非常小的额外移植工作之后找到了良好的性能。最后,我们得出结论,通过与仅在CPU上运行相比,我们应该能够实现适用于当前(预)超级计算机的GPU利用率,并实现显著的效率提高和实时加速。与此同时,我们发现未来的挑战将需要不同的方法,最重要的是需要大量人员进行软件开发投资。
作者:Bartosz Kostrzewa, Simone Bacchio, Jacob Finkenrath, Marco Garofalo, Ferenc Pittler, Simone Romiti, Carsten Urbach
论文ID:2212.06635
分类:High Energy Physics - Lattice
分类简称:hep-lat
提交时间:2022-12-14