具有袋子语义的概率查询评估
摘要:在被称为bag semantics的概率数据库上评估查询的复杂性研究。我们重点研究自由连接共同查询和发生在不同事实之间独立的概率数据库,这是元组独立概率数据库在bag semantics环境中的自然推广。对于集合语义,该问题的数据复杂性已经得到了很好的理解,甚至对于更一般的共同查询结合的类:根据查询的不同,它要么是多项式时间,要么是#P-hard(Dalvi&Suciu,JACM 2012)。 一个相当通用的bag概率数据库模型可能具有无界乘法因子。在这种情况下,概率数据库不再是有限的,并且需要对表示机制进行仔细处理。此外,对于布尔查询,答案是分布在(可能是所有)非负整数上的概率分布,而不是分布在{ true,false }上的概率分布。因此,我们讨论了两种概率查询评估的方式:计算答案元组多重性的期望,以及计算答案中某个参数k下的元组至多出现k次的概率。在对表达系统进行轻微技术假设的情况下,结果表明,即使对于共同查询结合,期望也很容易计算。对于查询答案概率,我们得到了自由连接共同查询的在多项式时间可解性和#P-hardness之间的二分法。
作者:Martin Grohe, Peter Lindner, Christoph Standke
论文ID:2201.11524
分类:Databases
分类简称:cs.DB
提交时间:2023-07-18