TED:探索图数据库中的前k个边多样化模式
摘要:分析图数据库中包含了大量的小型或中型数据图的需求日益强烈,例如化学化合物,因为图的数量呈指数级增长且来自不同的存储库。虽然子图枚举和子图挖掘已被提出,通过一组子图结构为图数据库提供洞察,但它们通常会得到类似或同构的拓扑结构,这在许多图应用中是不可取的。为了解决这个限制,我们提出了一种称为Top-k Edge-Diversified Patterns Discovery的问题,以从数据库中检索一组在边数最大的子图。为了高效处理这样的查询,我们提出了一个名为Ted的通用且可扩展的框架,它能够实现对最优结果的保证近似比率。进一步开发了两种优化策略来提高性能。对真实数据集进行的实验研究证明了Ted相对于传统技术的优越性。
作者:Kai Huang, Haibo Hu, Qingqing Ye, Kai Tian, Bolong Zheng, Xiaofang Zhou
论文ID:2212.07612
分类:Databases
分类简称:cs.DB
提交时间:2022-12-16