可扩展的时间范围k核查询在时态图上(完整版本)。

摘要:使用不同的时间约束条件查询时间图上的凝聚子图近年来引起了密集的研究兴趣。本文研究了一个新颖的Temporal k-Core Query(TCQ)问题:给定一个时间区间,在时间图的任意子区间中找到所有存在的不同k-core,这个问题可以推广到先前的历史性k-core查询。这个问题具有挑战性,因为子区间的数量与时间区间的跨度呈二次增长。为此,我们提出了一种新颖的Temporal Core Decomposition(TCD)算法,从先前引发的k-core中递减地引发时间k-core,从而显著减少了“内核内”的冗余计算。然后,我们引入了一个直观的概念,称为最紧密时间区间(TTI),用于时间k-core,并设计了一个具有理论保证的优化技术,利用TTI作为关键来预测哪些子区间会引发重复的k-core,并提前完全修剪子区间,从而消除了“内核间”的冗余计算。优化TCD(OTCD)算法的复杂性不再取决于查询时间区间的跨度,而仅取决于最终结果的规模,这意味着OTCD算法是可伸缩的。此外,我们提出了一种紧凑的内存数据结构,称为Temporal Edge List(TEL),以有限的内存需求在物理级别有效地实现OTCD算法。TEL将时间边缘组织在一个“时间线”上,当新边缘到达时可以立即更新,因此我们的方法也可以处理动态时间图。我们将OTCD算法与增量历史k-core查询在几个现实世界的时间图上进行比较,并观察到OTCD算法比它快三个数量级,即使OTCD算法不需要预先计算的索引。

作者:Junyong Yang, Ming Zhong, Yuanyuan Zhu, Tieyun Qian, Mengchi Liu, Jeffrey Xu Yu

论文ID:2301.03770

分类:Databases

分类简称:cs.DB

提交时间:2023-03-21

PDF 下载: 英文版 中文版pdf翻译中