COLE:面向区块链系统的基于列的学习存储

摘要:区块链系统的存储成本较高,因为每个节点都需要存储和维护完整的区块链数据。在调查以太坊的存储情况后,我们发现存储成本主要来自于索引,即用于保证数据完整性和支持原产地查询的Merkle Patricia Trie (MPT)。为了减少索引存储开销,一个初始的想法是利用新兴的学习索引技术,该技术已经证明具有较小的索引大小和更高效的查询性能。然而,将其直接应用于区块链存储会导致更高的开销,原因是区块链具有持久性要求,而学习索引具有较大的节点大小。同时,现有的学习索引是为内存数据库设计的,而区块链系统需要基于磁盘的存储,并具有频繁的数据更新功能。为解决这些挑战,我们提出了COLE,一种面向区块链系统的新型基于列的学习存储。我们遵循基于列的数据库设计,将每个状态的历史值连续存储,并通过学习模型进行索引,以实现高效的数据检索和原产地查询。我们开发了一系列针对磁盘环境的写优化策略来实现COLE。我们进行了广泛的实验,验证了所提出的COLE系统的性能。与MPT相比,COLE将存储大小降低了高达94%,同时提高了系统吞吐量1.4倍至5.4倍。

作者:Ce Zhang, Cheng Xu, Haibo Hu, Jianliang Xu

论文ID:2306.10739

分类:Databases

分类简称:cs.DB

提交时间:2023-06-21

PDF 下载: 英文版 中文版pdf翻译中