将Skyline查询集成到Spark SQL中
摘要:将天际线查询频繁用于数据分析和多标准决策支持应用中,以从海量数据中筛选出相关信息。Apache Spark是一个流行的处理大规模分布式数据的框架,该框架通过Spark SQL模块甚至提供了方便的类SQL接口。然而,天际线查询不受本地支持,需要繁琐地重写以适应SQL标准或Spark的类SQL语言。我们的工作目标是填补这一空白。因此,我们在Spark SQL中提供了天际线运算符的完整集成。这允许使用简单和易于使用的语法输入天际线查询。此外,我们的实证结果表明,天际线查询的集成解决方案远远优于基于重写为标准SQL的解决方案。
作者:Lukas Grasmann, Reinhard Pichler, Alexander Selzer
论文ID:2210.03718
分类:Databases
分类简称:cs.DB
提交时间:2022-10-10