DILI: 一种基于分布驱动的学习索引(扩展版)
摘要:基于内存中的一维搜索键,我们提出了一种新颖的基于分布学习的索引树(DILI),其中每个节点使用简洁且计算高效的线性回归模型。内部节点的键范围被其子节点等分,以便键搜索具有完美的模型预测准确性,以找到相关的叶节点。叶节点使用机器学习模型生成可搜索的数据布局,并准确预测键的数据记录位置。为了构建DILI,我们首先根据全局和局部键分布构建一个自底向上的树,并使用线性回归模型。使用自底向上的树,我们以自顶向下的方式构建DILI,根据局部分布个性化地设置内部节点的分支数。DILI在叶节点的数量和树的高度两个关键因素上取得了良好的平衡,这是键搜索时间的两个关键因素。此外,我们为DILI设计了灵活的算法,以便在需要时高效地插入和删除键,并自动调整树结构。广泛的实验结果显示,DILI在不同类型的工作负载上优于现有的最先进解决方案。
作者:Pengfei Li, Hua Lu, Rong Zhu, Bolin Ding, Long Yang and Gang Pan
论文ID:2304.08817
分类:Databases
分类简称:cs.DB
提交时间:2023-05-19