Intel(R) OptaneTM DC持久内存在大规模神经影像数据的并行处理中的性能优助益
摘要:大规模神经影像数据集已达到PB级,并持续增长。利用这些数据集的能力仅限于少数具备处理数据的能力和基础架构的实验室。尽管大数据引擎在数据移动方面大大减少了应用程序性能损失,但它们所采用的策略(如数据局部性、内存计算和延迟评估)在神经影像工作流中并不一定实用,因为中间结果可能需要被实例化到共享存储以进行后处理分析。在本文中,我们评估了使用Intel(R)OptaneTM DC持久内存处理大规模神经影像数据集的性能优势,使用两种可用配置模式:内存模式和应用模式。我们在76 GiB和603 GiB BigBrain上使用合成算法,并在Consortium for Reliability and Reproducibility(CoRR)数据集上应用标准神经影像应用,分别使用25个和96个并行进程进行处理。我们的结果表明,利用持久内存的应用程序性能优于其他存储设备,除了DRAM。无论数据量和并行性如何,无论是在内存模式还是应用模式下,都是如此。此外,我们认为当输出数据远小于可用内存时,应用模式下的持久内存有望从DRAM作为写入缓存中受益。我们相信,持久内存的使用对于在高性能计算或可视化大规模高分辨率图像时的神经影像应用都将有益。
作者:Valerie Hayot-Sasson, Shawn T Brown and Tristan Glatard
论文ID:1912.11794
分类:Performance
分类简称:cs.PF
提交时间:2019-12-30