自动NUMA内存层级化在图分析中的性能特征化
摘要:非易失性存储器(NVM)与DRAM相比,可以提供更高的密度和更低的每比特成本。其主要缺点是速度比DRAM慢。另一方面,DRAM由于成本和能耗问题存在可伸缩性问题。NVM很可能与DRAM共存于计算机系统中,最大的挑战是确定哪些数据分配到每种类型的存储器中。目前的一种先进方法是AutoNUMA,在Linux内核中实现。以前的研究仅限于从应用程序执行时间的角度衡量AutoNUMA,而不了解AutoNUMA的行为。在这项工作中,我们对AutoNUMA进行了更深入的表征,例如,确定一组页面实际上分配在哪里,同时跟踪AutoNUMA执行的升级和降级决策。我们的分析表明,运行图处理应用程序或图分析应用程序时,AutoNUMA的好处可能相对较小,因为大多数页面在整个执行时间内只有一次访问,其他页面访问没有时序局部性。我们提出探索使用对象级映射在DRAM和NVM之间的应用程序特性的论点。我们的初步实验表明,与AutoNUMA相比,对象级内存分层可以更好地捕捉应用程序的行为,并将图分析的执行时间平均减少了21%,最大减少了51%,同时显著减少了NVM中的内存访问次数。
作者:Diego Moura, Vinicius Petrucci, Daniel Mosse
论文ID:2212.04344
分类:Performance
分类简称:cs.PF
提交时间:2022-12-09