社区搜索:一种元学习方法

摘要:社区搜索(CS)是基本的图分析任务之一,也是各种实际应用的构建模块之一。给定任意查询节点,CS旨在找到查询节点所属的凝聚子图。最近,设计了大量CS算法。这些算法采用预定义的子图模式来模拟社区,这些模式在现实世界的图中无法找到没有这种预定义模式的真实社区。因此,提出了基于机器学习(ML)和深度学习(DL)的方法,通过从数据驱动的方式学习来捕捉灵活的社区结构,而不是事先收集充分的训练数据以为ML模型提供足够的泛化。在本文中,我们研究了在训练数据稀缺情况下对CS进行ML/DL方法的应用。我们通过学习一个元模型来提取跨多个CS任务共享的先验知识,而不是直接拟合这些有限的数据。每个CS任务是一个具有几个查询的图,并具有相应的部分真实值。元模型可以通过提供一些特定任务的训练数据来迅速适应预测任务。我们发现,将多个经典的元学习算法直接应用于CS会导致关于预测效果、泛化能力和效率的问题。为了解决这些问题,我们提出了一种新颖的基于元学习的框架,条件图神经过程(CGNP),以完成先验知识的提取和适应过程。元CGNP模型是一个用于聚类的任务公共节点嵌入函数,通过基于度量的图学习进行学习,充分利用了CS的特点。我们在具有真实社区的实际图上将CGNP与CS算法和ML基线进行了比较。

作者:Shuheng Fang, Kangfei Zhao, Guanghua Li, Jeffery Xu Yu

论文ID:2201.00288

分类:Databases

分类简称:cs.DB

提交时间:2023-03-01

PDF 下载: 英文版 中文版pdf翻译中