LMSFC:一种基于学习单调空间填充曲线的新型多维索引

摘要:学习索引的最新提议引起了广泛关注,因为它们能够适应实际数据和查询分布,以达到更好的搜索效率。基于这种技术,一些现有工作构建了多维数据的索引,并实现了改进的查询性能。这些工作的一个常见范例是将多维数据点映射到一维空间,使用固定的空间填充曲线(SFC)或其变种,然后应用学习索引技术。我们注意到,第一步通常使用固定的SFC方法,例如行主顺序和z顺序。这肯定限制了学习多维索引通过不同的查询工作负载来适应不同数据分布的潜力。在本文中,我们提出了一个新的想法,即学习一个经过精心设计和主动优化以进行高效查询处理的空间填充曲线。我们还确定了基于SFC的学习索引的创新的离线和在线优化机会,并提供最优和/或启发式解决方案。实验结果表明,我们提出的方法LMSFC在三个常用的真实世界数据集和各种实验设置下,优于最先进的非学习或学习方法。

作者:Jian Gao, Xin Cao, Xin Yao, Gong Zhang, Wei Wang

论文ID:2304.12635

分类:Databases

分类简称:cs.DB

提交时间:2023-06-22

PDF 下载: 英文版 中文版pdf翻译中