发现图实体依赖(GEDs)的高效方法

摘要:图实体依赖(GEDs)是一种新颖的图约束,统一了属性图的键和功能依赖关系。在许多实际的数据质量和数据管理任务中,如社交媒体网络上的事实核查和实体解析,它们被发现非常有用。在本文中,我们研究了GEDs的发现问题-在给定的图数据中找到有效GEDs的最小覆盖。我们正式定义了这个问题,并提出了一种有效而高效的方法来克服GED发现中的主要瓶颈。特别是,我们利用现有的图分区算法来实现快速的GED范围发现,并采用有效的修剪策略来处理候选依赖关系空间的过大问题。此外,我们基于最小描述长度原则定义了一种GED的有趣度度量,用于对挖掘到的GED覆盖集进行评分和排序。最后,我们通过在真实的基准图数据集上进行广泛的实验来证明我们的GED发现方法的可扩展性和有效性,并展示了在不同的下游数据质量管理应用中发现的规则的实用性。

作者:Dehua Liu, Selasi Kwashie, Yidi Zhang, Guangtong Zhou, Michael Bewong, Xiaoying Wu, Xi Guo, Keqing He, Zaiwen Feng

论文ID:2301.06264

分类:Databases

分类简称:cs.DB

提交时间:2023-07-04

PDF 下载: 英文版 中文版pdf翻译中