使用BSC性能工具理解内存访问模式

摘要:处理器和内存速度之间不断增长的差距导致了复杂的内存层次结构,处理器通过利用引用局部性来减轻这种差距。在这方面,最近扩展了BSC性能分析工具,以提供与应用内存访问相关的时间和空间特性,并与源代码和实现的性能同时相关。这些扩展依赖于最新的Intel处理器中的Precise Event-Based Sampling (PEBS)机制,用于捕获有关应用内存访问的信息。采样的信息随后与折叠技术结合,以表示内存访问的详细时间演变,并与实现的性能和源代码对应。从这些工具的组合获得的结果不仅有助于应用程序开发人员,还有助于处理器架构师更好地了解应用程序的行为以及系统的性能。在本文中,我们描述了将采样机制更紧密地集成到监控包中。我们还通过探索已经优化的最新基准测试的内存访问行为,展示了完整工作流的价值。我们利用这些见解进行了小的修改,以改善应用程序的性能。

作者:Harald Servat and Jes''us Labarta and Hans-Christian Hoppe and Judit Gim''enez and Antonio J. Pe~na

论文ID:2005.05872

分类:Performance

分类简称:cs.PF

提交时间:2020-06-01

PDF 下载: 英文版 中文版pdf翻译中