查询回答中事实的Banzhaf值
摘要:数据库事实对查询答案的贡献的量化已被研究为解释的手段。Banzhaf值在博弈论中最初开发,在选择-投影-连接-并集查询中进行有效计算是具有挑战性的。在本文中,我们引入了三种算法来计算数据库事实的Banzhaf值:一种精确算法,一种具有相对误差保证的任何时候确定性近似算法,和一种用于排名和top-k的算法。它们有三个关键构建块:将查询谱系编译成等价函数,从而实现高效的Banzhaf值计算;使用组成函数的Banzhaf值动态规划计算布尔函数变量的Banzhaf值;以及一种计算任何正DNF函数的Banzhaf值下限和上限的机制。 我们在Banzhaf基于排名问题上补充了二分法:给定两个事实,决定其中一个的Banzhaf值是否大于另一个的问题对于分层查询是易处理的,对于非分层查询是难处理的。 我们通过实验证明,我们的算法在大多数情况下比之前的精确算法和近似算法显著提高了两个数量级。我们的算法还可以处理以前的工作无法解决的具有挑战性的问题实例。
作者:Omer Abramovich, Daniel Deutch, Nave Frost, Ahmet Kara, Dan Olteanu
论文ID:2308.05588
分类:Databases
分类简称:cs.DB
提交时间:2023-08-11