教程:无处不在的跳跃表及其变种在现代大数据系统中的应用

摘要:跳表(Skiplist)最初被设计为内存数据结构,近年来作为NoSQL、基于云的和大数据系统的主存组件,引起了广泛关注。与B树不同,跳表不需要复杂的平衡机制,但仍然表现出预期的对数性能。它支持多种操作,包括插入、点读和范围查询。为了使跳表更加多功能,对其节点结构、构造算法、链表结构、并发访问等进行了许多优化。在许多大数据系统场景中,已经提出并尝试了许多跳表的变种。 除了作为主内存组件外,跳表还在系统中作为核心索引来解决写放大、写停顿、排序、范围查询处理等问题。在本教程中,我们全面介绍了跳表及其变种、优化和各种用例,以展示现代数据系统中使用跳表或类似结构的优势。

作者:Venkata Sai Pavan Kumar Vadrevu, Lu Xing, Walid G. Aref

论文ID:2304.09983

分类:Databases

分类简称:cs.DB

提交时间:2023-04-21

PDF 下载: 英文版 中文版pdf翻译中