函数依赖的不一致性度量的夏普利值
摘要:数据库不一致性的量化是出于各种目标的动机,包括对新数据集的可靠性估计和数据清洗中的进展指示。另一个目标是将不一致性的责任归属于个别元组,并以此优先考虑元组在清理或检查脏数据时的重要性。因此,不一致性量化和归因已经成为知识表示和最近在数据库中的研究课题。与许多其他领域一样,协作博弈理论中的Shapley值是一种传统的责任共担机制。在本文中,我们对函数依赖(FD)违规常见的不一致度量进行了系统的研究,包括Shapley值的复杂性。对于多个度量,我们将FD集合完全分类为可处理和难以处理的类别,并针对Shapley值计算进行了研究。我们还研究了在难以处理的情况下近似计算的复杂性。
作者:Ester Livshits and Benny Kimelfeld
论文ID:2009.13819
分类:Databases
分类简称:cs.DB
提交时间:2023-06-22