神经草图:使用神经网络快速且近似评估范围聚合查询

摘要:查询范围聚合(RAQ)是许多现实世界应用程序的重要组成部分,通常需要快速和近似的查询答案。最近的研究已经研究了使用机器学习(ML)模型回答RAQ的方法,在这种方法中,学习数据模型来回答查询。然而,目前没有理论上的理解为什么和何时ML方法表现良好。此外,由于ML方法对数据进行建模,它们无法充分利用任何特定于查询的信息来提高实际性能。在本文中,我们重点研究建模“查询”而不是数据,并训练神经网络学习查询答案。这种转变的焦点使我们能够在回答RAQ时对神经网络提供一个分布和查询相关的误差界。我们通过开发NeuroSketch来验证我们的理论结果,这是一个用于实际回答RAQ的神经网络框架。对真实世界、TPC基准测试和合成数据集进行的广泛实验研究表明,NeuroSketch比最先进的方法回答RAQ快几个数量级,并且具有更好的准确性。

作者:Sepanta Zeighami, Cyrus Shahabi, Vatsal Sharan

论文ID:2211.10832

分类:Databases

分类简称:cs.DB

提交时间:2023-04-11

PDF 下载: 英文版 中文版pdf翻译中