随机LapH方法中重子块构建的性能优化

摘要:高级Lattice QCD框架中测量核心的实施可以实现快速原型设计,但可能导致硬件能力被显著低效利用。如果在未优化的例程中所花费的时间通常很少,这是可以接受的权衡。然而,现代光谱学项目的计算成本可能与生成规范配置和计算Dirac方程解的成本相当甚至超过。在随机LapH方法中,一个重要的核心是计算重子块;我们讨论了几种实施策略,并在一台配备Intel(R) Xeon(R) Platinum 8358处理器(之前称为Ice Lake)的系统上实现了7.2倍的加速。

作者:Phuong Nguyen and Ben H"orz

论文ID:2211.16278

分类:High Energy Physics - Lattice

分类简称:hep-lat

提交时间:2022-11-30

PDF 下载: 英文版 中文版pdf翻译中