在HPC系统中采用分离内存的定量方法
摘要:内存分离最近已经在数据中心中被采用,以提高资源利用率,这是由于成本和可持续性的动力。最近对大规模HPC设施的研究还强调了内存的低利用率。内存池化是一种有前途且非破坏性的内存分离选项,其中共享内存池补充节点本地内存。这项工作概述了采用的前景和要求,并澄清了几个误解。我们提出了一种定量方法,通过三个层次从上到下剖析应用程序对内存系统的要求,从通用到多层内存系统,再到内存池化。我们提供了一个多级分析工具和LBench,以便促进定量方法。我们在一个模拟平台上评估了一组代表性的HPC工作负载。我们的结果表明,预抓取活动可以显著影响内存流量配置文件。内存池化中的干扰对应用程序有不同的影响,取决于它们对内存层和算术强度的访问比例。最后,在两个案例研究中,我们展示了我们在应用程序和系统层面上的发现带来的好处,在远程访问方面实现50%的减少,在BFS方面加速13%,并减少干扰感知作业调度中共同部署工作负载的性能变化。
作者:Jacob Wahlgren, Gabin Schieffer, Maya Gokhale, Ivy Peng
论文ID:2308.14780
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-08-30