数据库查询处理中的偏移值编码-arXiv论文预印本中文版

数据库查询处理中的偏移值编码

摘要：利用偏移值编码可以加快数据库查询的执行速度，不仅可以用于排序，还可以用于去重和分组（聚合）、有序交换（洗牌）、合并连接等操作。在Google的Napa和F1 Query系统中，它已经节省了数千个CPU，例如在分组算法和日志结构化合并树中。然而，为了充分发挥有序排列的好处，查询执行算法不仅必须消耗并利用偏移值编码，还必须为管道中的下一个操作符生成偏移值编码。我们的研究寻求了在不逐个比较连续输出行和列的情况下生成偏移值编码的方法。本文介绍了一个新的定理，并基于其证明和一个简单的推论详细描述了如何计算有序算法（从过滤到合并连接甚至洗牌）的输出的偏移值编码。这些计算非常简单和高效。

作者：Goetz Graefe, Thanh Do

论文ID：2210.00034

分类：Databases

分类简称：cs.DB

提交时间：2023-02-20

PDF 下载： 英文版中文版pdf翻译中