TED:探索图数据库中的前k个边多样化模式

摘要:分析图数据库中包含了大量的小型或中型数据图的需求日益强烈,例如化学化合物,因为图的数量呈指数级增长且来自不同的存储库。虽然子图枚举和子图挖掘已被提出,通过一组子图结构为图数据库提供洞察,但它们通常会得到类似或同构的拓扑结构,这在许多图应用中是不可取的。为了解决这个限制,我们提出了一种称为Top-k Edge-Diversified Patterns Discovery的问题,以从数据库中检索一组在边数最大的子图。为了高效处理这样的查询,我们提出了一个名为Ted的通用且可扩展的框架,它能够实现对最优结果的保证近似比率。进一步开发了两种优化策略来提高性能。对真实数据集进行的实验研究证明了Ted相对于传统技术的优越性。

作者:Kai Huang, Haibo Hu, Qingqing Ye, Kai Tian, Bolong Zheng, Xiaofang Zhou

论文ID:2212.07612

分类:Databases

分类简称:cs.DB

提交时间:2022-12-16

PDF 下载: 英文版 中文版pdf翻译中