概率数据库查询的共识答案

摘要:在概率数据库上找到最佳确定性查询答案的问题,我们提出了共识世界(或共识答案)的概念,它是将期望距离最小化到可能世界(答案)的确定性世界(答案)。这个问题可以看作是对概率数据库中的不一致信息聚合问题(如排名聚合)的泛化。我们考虑了各种类型的查询,包括SPJ查询、Topk查询、group-by聚合查询和聚类。对于不同的距离度量,我们得到了计算共识答案的多项式时间最优或近似算法(或证明NP难度)。我们大部分的结果都是针对一个称为“与/异或树模型”的通用概率数据库模型的,该模型在很大程度上推广了之前的概率数据库模型,如x-元组和分块独立不相交模型,并且具有独立的兴趣。

作者:Jian Li, Amol Deshpande

论文ID:0812.2049

分类:Databases

分类简称:cs.DB

提交时间:2008-12-12

PDF 下载: 英文版 中文版pdf翻译中