教程:无处不在的跳跃表及其变种在现代大数据系统中的应用
摘要:跳表(Skiplist)最初被设计为内存数据结构,近年来作为NoSQL、基于云的和大数据系统的主存组件,引起了广泛关注。与B树不同,跳表不需要复杂的平衡机制,但仍然表现出预期的对数性能。它支持多种操作,包括插入、点读和范围查询。为了使跳表更加多功能,对其节点结构、构造算法、链表结构、并发访问等进行了许多优化。在许多大数据系统场景中,已经提出并尝试了许多跳表的变种。 除了作为主内存组件外,跳表还在系统中作为核心索引来解决写放大、写停顿、排序、范围查询处理等问题。在本教程中,我们全面介绍了跳表及其变种、优化和各种用例,以展示现代数据系统中使用跳表或类似结构的优势。
作者:Venkata Sai Pavan Kumar Vadrevu, Lu Xing, Walid G. Aref
论文ID:2304.09983
分类:Databases
分类简称:cs.DB
提交时间:2023-04-21