短时间内和灵活地在晶格量子色动力学中实现威尔逊、布里渊和萨斯金德费米子

摘要:用现代Fortran实现了晶格量子色动力学中三个狄拉克算符(Wilson,Brillouin,Susskind),基于OpenMP共享内存并行化和SIMD指令。主要思想是同时对Nv个向量应用狄拉克算符,以减轻内存带宽瓶颈。所有索引计算都由编译器完成,并且最大限度地考虑了可移植性和灵活性。晶格体积NxNyNzNt、颜色数Nc和右手边数Nv是在编译时定义的参数。比较了几种内存布局选项。该代码在现代多核架构上表现良好(对于三个运算符,单精度情况下在72核KNL处理器上达到480 Gflop/s,880 Gflop/s和780 Gflop/s,在一个$2\times24$核Skylake节点上可以获得相似的结果)。使用CG/BiCGstab求逆器的显式运行时测试确认内存布局对KNL架构很重要,但对Skylake架构影响较小。辅助代码分发包含了所有的程序,包括单精度、双精度和混合精度的Krylov空间求解器,使其自包含并方便使用。

作者:Stephan Durr

论文ID:2112.14640

分类:High Energy Physics - Lattice

分类简称:hep-lat

提交时间:2021-12-30

PDF 下载: 英文版 中文版pdf翻译中