概率数据库中独立单元的一致性

摘要:属性级别不确定性的概率数据库由关系组成,其中一些属性的单元格可能保存的是概率分布,而不是确定的内容。这样的数据库在存在噪声操作的情况下隐式或显式地出现,例如缺失数据插补,我们自动填充缺失值;列预测,我们预测未知属性;以及数据库清理(和修复),我们由于检测到的错误或完整性约束的违反而替换原始值。我们研究了在完整性约束存在的情况下,关于选择单元格值的问题的计算复杂性。具体地说,我们关注函数依赖关系,并研究了三个问题:(1)决定是否可以通过任意值的选择来满足约束;(2)找到一个最有可能的选择;(3)计算满足约束的概率。这些问题的数据复杂性由函数依赖关系集合和不确定属性的组合确定。我们对几类约束问题(包括单个依赖关系、匹配约束和一元函数依赖关系)给出了可解和不可解复杂性的完全分类。

作者:Amir Gilad, Aviram Imber, Benny Kimelfeld

论文ID:2212.12104

分类:Databases

分类简称:cs.DB

提交时间:2022-12-26

PDF 下载: 英文版 中文版pdf翻译中