学习索引的基准测试

摘要:学习索引结构的最新进展提出用近似学习模型替代现有的索引结构,如B树。在本研究中,我们提出了一个统一的基准测试,将三种经过良好调优的学习索引结构的实现与几种最先进的“传统”基准进行比较。使用四个真实世界的数据集,我们证明学习索引结构确实可以在只读内存工作负载的浓密数组上胜过非学习索引。我们还研究了缓存、流水线、数据集大小和关键字大小的影响。我们研究了学习索引结构的性能特点,并解释了学习模型为何能实现如此好的性能。最后,我们研究了学习索引结构的其他重要性质,如它们在多线程系统中的性能和建立时间。

作者:Ryan Marcus, Andreas Kipf, Alexander van Renen, Mihail Stoian, Sanchit Misra, Alfons Kemper, Thomas Neumann, Tim Kraska

论文ID:2006.12804

分类:Databases

分类简称:cs.DB

提交时间:2023-03-28

PDF 下载: 英文版 中文版pdf翻译中