MARS:记忆感知的重排序源
摘要:内存带宽在今天的高性能计算系统中至关重要。对于GPU的工作负载,如3D游戏、图像处理和感知计算,由于其数据密集的特性,带宽尤为重要。随着每一代GPU中线程和数据流的增加,以及高可用内存带宽,内存效率也是实现所需性能的关键。在存在多个并发数据流的情况下,单个数据流内固有的局部性经常会丧失,因为这些数据流在经过多个内存层级时被交叉。在基于DRAM的主存储器中,糟糕的请求局部性会减少行缓冲区重用,导致内存带宽的低利用率和低效率。在本文中,我们提出了一个名为MARS(Memory-Aware Reordered Source)的体系结构,以解决由高度交叉的数据流引起的内存效率问题。MARS的关键思想是,在主存储器之前有足够大的前瞻,可以根据行缓冲区地址重新排序数据流,以恢复丢失的局部性并提高内存效率。我们证明,对于一组合成微基准测试,MARS提高了实现的内存带宽11%。此外,MARS在不需要对内存配置进行任何特定了解的情况下实现了这一点。
作者:Ishwar Bhati, Udit Dhawan, Jayesh Gaur, Sreenivas Subramoney, and Hong Wang
论文ID:1808.03518
分类:Performance
分类简称:cs.PF
提交时间:2018-08-13