自动NUMA内存层级化在图分析中的性能特征化-arXiv论文预印本中文版

自动NUMA内存层级化在图分析中的性能特征化

摘要：非易失性存储器（NVM）与DRAM相比，可以提供更高的密度和更低的每比特成本。其主要缺点是速度比DRAM慢。另一方面，DRAM由于成本和能耗问题存在可伸缩性问题。NVM很可能与DRAM共存于计算机系统中，最大的挑战是确定哪些数据分配到每种类型的存储器中。目前的一种先进方法是AutoNUMA，在Linux内核中实现。以前的研究仅限于从应用程序执行时间的角度衡量AutoNUMA，而不了解AutoNUMA的行为。在这项工作中，我们对AutoNUMA进行了更深入的表征，例如，确定一组页面实际上分配在哪里，同时跟踪AutoNUMA执行的升级和降级决策。我们的分析表明，运行图处理应用程序或图分析应用程序时，AutoNUMA的好处可能相对较小，因为大多数页面在整个执行时间内只有一次访问，其他页面访问没有时序局部性。我们提出探索使用对象级映射在DRAM和NVM之间的应用程序特性的论点。我们的初步实验表明，与AutoNUMA相比，对象级内存分层可以更好地捕捉应用程序的行为，并将图分析的执行时间平均减少了21％，最大减少了51％，同时显著减少了NVM中的内存访问次数。

作者：Diego Moura, Vinicius Petrucci, Daniel Mosse

论文ID：2212.04344

分类：Performance

分类简称：cs.PF

提交时间：2022-12-09

PDF 下载： 英文版中文版pdf翻译中