HGMatch:一个基于超边的子图匹配方法用于超图

摘要:超图是图的一种泛化形式,其中超边可以连接任意数量的顶点。与传统图相比,它可以描述N元关系和实体之间的高阶信息。本文研究了超图上的子图匹配问题(即子超图匹配)。现有方法直接将子图匹配算法扩展到超图的情况。然而,这种方法延迟了超边验证并且未充分利用超图中的高阶信息,导致搜索空间大和枚举成本高。此外,随着超图规模的增加,按顺序计算子超图匹配变得困难。因此,我们提出了一种高效且并行的子超图匹配系统HGMatch,用于处理大规模超图中的子超图匹配。我们提出了一种新颖的超边匹配框架来利用超图中的高阶信息,并使用集合操作以实现高效的候选生成。此外,我们基于数据流模型开发了一个经过优化的并行执行引擎,在任务级别调度程序和细粒度动态任务窃取下实现了有界内存执行和更好的负载均衡。对10个实际数据集的实验评估表明,当使用单个线程时,HGMatch在性能上比最先进的子图匹配算法(CFL、DAF、CECI和RapidMatch)有数量级的提升,并且在线程数增加时实现了几乎线性的可扩展性。

作者:Zhengyi Yang, Wenjie Zhang, Xuemin Lin, Ying Zhang, Shunyang Li

论文ID:2302.06119

分类:Databases

分类简称:cs.DB

提交时间:2023-02-21

PDF 下载: 英文版 中文版pdf翻译中