FZ-GPU:一种用于GPU上科学计算应用的快速高压缩比有损压缩器

摘要:高性能计算系统上运行的大规模科学应用程序产生了大量的数据。因此,数据压缩正在成为减轻存储负担和数据移动成本的关键技术。然而,现有的科学数据有损压缩算法无法同时实现高压缩比和吞吐量,这阻碍了它们在许多需要快速压缩的应用中的采用,如内存压缩。为此,在本研究中,我们针对科学数据在GPU上开发了一种快速且高比例的误差有界有损压缩算法(称为FZ-GPU)。具体而言,我们首先设计了一个新的压缩流水线,包括完全并行化的量化、位洗牌和我们新设计的快速编码。然后,我们为流水线中的每个核心提出了一系列深度架构优化,充分利用了CUDA架构的优势。我们提出了一种面向线程束的优化,以避免位操作中的数据冲突,最大限度地利用共享内存,并通过融合不同的压缩核心来消除不必要的数据移动。最后,我们使用来自SDRBench的六个代表性科学数据集在两个NVIDIA GPU(即A100和RTX A4000)上评估了FZ-GPU。在A100 GPU上的结果表明,FZ-GPU相对于cuSZ的平均加速比为4.2倍,在相同的误差界限下,相对于我们算法的多线程CPU实现的平均加速比为37.0倍。在相同的数据失真下,FZ-GPU相对于cuZFP的平均加速比为2.3倍,平均压缩比提升为2.0倍。

作者:Boyuan Zhang, Jiannan Tian, Sheng Di, Xiaodong Yu, Yunhe Feng, Xin Liang, Dingwen Tao, Franck Cappello

论文ID:2304.12557

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-05-04

PDF 下载: 英文版 中文版pdf翻译中