自适应编码策略用于基于抹除的无损浮点压缩

摘要:无损浮点时间序列压缩对于各种关键场景非常重要。然而,由于浮点数值的复杂底层布局,无损压缩时间序列是一个巨大的挑战。最先进的擦除-based压缩算法Elf展示了非常出色的性能。我们对Elf的编码策略进行了深入探索,并发现仍有很大的改进空间。在本文中,我们提出了Elf*,它采用了一组针对前导零、中心位和共享条件的优化。具体而言,我们开发了一个动态规划算法,并使用一组修剪策略来高效计算自适应近似规则。我们在理论上证明了自适应近似规则是全局最优的。我们进一步将Elf*扩展为Streaming Elf*,即SElf*,它在流式场景中实现了几乎与Elf*相同的压缩比,同时享受更高的效率。我们使用22个数据集将Elf*和SElf*与8个竞争者进行了比较。结果表明,SElf*相对于最佳流式竞争者实现了9.2%的相对压缩比提高,同时保持类似的效率,并且Elf*位居最具竞争力的批处理压缩器之列。所有源代码已公开发布。

作者:Ruiyuan Li, Zheng Li, Yi Wu, Chao Chen, Tong Liu, Yu Zheng

论文ID:2308.11915

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-08-24

PDF 下载: 英文版 中文版pdf翻译中