CXL内存作为非集中HPC的持久性内存:一种实用方法
摘要:计算机高性能计算中寻求高效可扩展存储解决方案的问题至关重要。计算表达链接(CXL)的出现为解决可分离式高性能计算系统中持久性内存(PMem)的问题开辟了一个有潜力的途径。本文通过对配备CXL附加内存原型的尖端多NUMA节点进行物理实验,全面探讨了CXL内存作为PMem候选方案的可行性。我们的研究不仅对CXL内存的性能进行了基准测试,还说明了从传统PMem编程模型向CXL的平滑过渡,加强了其实用性。 为了证实我们的论点,我们使用包含CXL 1.1/2.0兼容终端设计(英特尔FPGA CXL IP)的FPGA卡建立了一个具体的CXL原型。通过STREAM和STREAM-PMem基准测试,执行了性能评估,展示了CXL内存在App-Direct和Memory Mode中模拟PMem特性的能力,并在与英特尔第四代至强(Sapphire Rapids)处理器配合使用时实现了令人印象深刻的带宽指标。 结果阐明了CXL内存作为持久性内存解决方案的可行性,超越了先前所建立的基准测试。与已发表的DCPMM结果相比,我们的CXL-DDR4内存模块在带宽上与本地DDR4内存配置相当,尽管性能有所下降。修改后的STREAM-PMem应用程序凸显了从PMem向CXL的编程模型过渡的简单性,从而强调了采用CXL内存的实用性。
作者:Yehonatan Fridman, Suprasad Mutalik Desai, Navneet Singh, Thomas Willhalm, Gal Oren
论文ID:2308.10714
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-08-22