TED：探索图数据库中的前k个边多样化模式-arXiv论文预印本中文版

TED：探索图数据库中的前k个边多样化模式

摘要：分析图数据库中包含了大量的小型或中型数据图的需求日益强烈，例如化学化合物，因为图的数量呈指数级增长且来自不同的存储库。虽然子图枚举和子图挖掘已被提出，通过一组子图结构为图数据库提供洞察，但它们通常会得到类似或同构的拓扑结构，这在许多图应用中是不可取的。为了解决这个限制，我们提出了一种称为Top-k Edge-Diversified Patterns Discovery的问题，以从数据库中检索一组在边数最大的子图。为了高效处理这样的查询，我们提出了一个名为Ted的通用且可扩展的框架，它能够实现对最优结果的保证近似比率。进一步开发了两种优化策略来提高性能。对真实数据集进行的实验研究证明了Ted相对于传统技术的优越性。

作者：Kai Huang, Haibo Hu, Qingqing Ye, Kai Tian, Bolong Zheng, Xiaofang Zhou

论文ID：2212.07612

分类：Databases

分类简称：cs.DB

提交时间：2022-12-16

PDF 下载： 英文版中文版pdf翻译中