随机LapH方法中重子块构建的性能优化
摘要:高级Lattice QCD框架中测量核心的实施可以实现快速原型设计,但可能导致硬件能力被显著低效利用。如果在未优化的例程中所花费的时间通常很少,这是可以接受的权衡。然而,现代光谱学项目的计算成本可能与生成规范配置和计算Dirac方程解的成本相当甚至超过。在随机LapH方法中,一个重要的核心是计算重子块;我们讨论了几种实施策略,并在一台配备Intel(R) Xeon(R) Platinum 8358处理器(之前称为Ice Lake)的系统上实现了7.2倍的加速。
作者:Phuong Nguyen and Ben H"orz
论文ID:2211.16278
分类:High Energy Physics - Lattice
分类简称:hep-lat
提交时间:2022-11-30