将Skyline查询集成到Spark SQL中

摘要:将天际线查询频繁用于数据分析和多标准决策支持应用中,以从海量数据中筛选出相关信息。Apache Spark是一个流行的处理大规模分布式数据的框架,该框架通过Spark SQL模块甚至提供了方便的类SQL接口。然而,天际线查询不受本地支持,需要繁琐地重写以适应SQL标准或Spark的类SQL语言。我们的工作目标是填补这一空白。因此,我们在Spark SQL中提供了天际线运算符的完整集成。这允许使用简单和易于使用的语法输入天际线查询。此外,我们的实证结果表明,天际线查询的集成解决方案远远优于基于重写为标准SQL的解决方案。

作者:Lukas Grasmann, Reinhard Pichler, Alexander Selzer

论文ID:2210.03718

分类:Databases

分类简称:cs.DB

提交时间:2022-10-10

PDF 下载: 英文版 中文版pdf翻译中