正则路径查询中的Shapley值的复杂性
摘要:路径查询从标记图中提取顶点元组,基于连接顶点的路径形成的单词。我们研究计算边缘和顶点对路径查询答案的贡献的计算复杂性,重点研究连续正则路径查询类别。为了衡量这种贡献,我们采用合作博弈理论中的传统Shapley值。这个值最近在关系数据库查询的背景下提出和研究,并且在许多其他领域中有用途。 我们首先研究边缘的贡献,并且显示准确的Shapley值几乎总是很难计算。具体来说,每当至少一个(非冗余)连词允许一个长度为三或更高的单词时,计算一条边缘的贡献即为#P困难。对于正则路径查询的情况(即没有连词),如果查询只有长度最长为二的单词,则问题是可解的;因此,这个属性完全刻画了问题的可解性。另一方面,如果允许有近似误差,则可以轻松获得一种有效的方案(FPRAS)来进行加性逼近。然而,要获得一种乘法逼近较为困难。我们证明,在连续正则路径查询的情况下,如果所有查询原子是有限语言(假设非冗余和常规复杂性限制),则可以在多项式时间内计算边的Shapley值的乘法逼近。我们还研究了类似的情况,即希望确定顶点的贡献,而不是边缘,并且得出了类似性质的复杂性结果。
作者:Majd Khalil, Benny Kimelfeld
论文ID:2212.07720
分类:Databases
分类简称:cs.DB
提交时间:2022-12-16