内存访问的低级抽象更新
摘要:为每个硬件架构选择最佳的内存布局变得越来越重要,因为越来越多的程序变得内存受限。对于在异构硬件架构上运行的便携代码来说,数据结构的内存布局选择理想情况下应与程序的其他部分解耦。低级内存访问抽象(LLAMA)是一个C++库,它提供了一个零运行时开销的抽象层,底层可以自由地交换内存映射来定制数据布局、内存访问和访问工具,重点是多维数组和嵌套结构化数据。 在LLAMA的科学首次亮相之后,又添加了几个改进和扩展。包括用于零内存开销视图的编译时数组范围、支持内存访问期间的计算、位压缩、类型切换、字节分割、内存访问工具和显式的SIMD支持的新映射。本文提供了LLAMA库最新发展的概述。
作者:Bernhard Manfred Gruber
论文ID:2302.08251
分类:Performance
分类简称:cs.PF
提交时间:2023-02-17