FZ-GPU：一种用于GPU上科学计算应用的快速高压缩比有损压缩器-arXiv论文预印本中文版

FZ-GPU：一种用于GPU上科学计算应用的快速高压缩比有损压缩器

摘要：高性能计算系统上运行的大规模科学应用程序产生了大量的数据。因此，数据压缩正在成为减轻存储负担和数据移动成本的关键技术。然而，现有的科学数据有损压缩算法无法同时实现高压缩比和吞吐量，这阻碍了它们在许多需要快速压缩的应用中的采用，如内存压缩。为此，在本研究中，我们针对科学数据在GPU上开发了一种快速且高比例的误差有界有损压缩算法（称为FZ-GPU）。具体而言，我们首先设计了一个新的压缩流水线，包括完全并行化的量化、位洗牌和我们新设计的快速编码。然后，我们为流水线中的每个核心提出了一系列深度架构优化，充分利用了CUDA架构的优势。我们提出了一种面向线程束的优化，以避免位操作中的数据冲突，最大限度地利用共享内存，并通过融合不同的压缩核心来消除不必要的数据移动。最后，我们使用来自SDRBench的六个代表性科学数据集在两个NVIDIA GPU（即A100和RTX A4000）上评估了FZ-GPU。在A100 GPU上的结果表明，FZ-GPU相对于cuSZ的平均加速比为4.2倍，在相同的误差界限下，相对于我们算法的多线程CPU实现的平均加速比为37.0倍。在相同的数据失真下，FZ-GPU相对于cuZFP的平均加速比为2.3倍，平均压缩比提升为2.0倍。

作者：Boyuan Zhang, Jiannan Tian, Sheng Di, Xiaodong Yu, Yunhe Feng, Xin Liang, Dingwen Tao, Franck Cappello

论文ID：2304.12557

分类：Distributed, Parallel, and Cluster Computing

分类简称：cs.DC

提交时间：2023-05-04

PDF 下载： 英文版中文版pdf翻译中