超图中的重叠和稳健边缘着色聚类

摘要:具有分类关系类型的数据挖掘中最近的趋势是探索(超)图聚类算法。这样的算法在社交、合著和蛋白质相互作用网络的分析中有一定的应用。许多这样的应用程序自然地存在一些群集之间的重叠,这是当前组合模型所缺少的一个细微差别。此外,现有模型缺乏处理数据集中噪声的机制。为了解决这些问题,我们对分类超图的最近框架Edge-Colored Clustering进行了概括。我们的概括允许拥有一个(a)重叠的群集分配或(b)节点删除的有限数量。对于每个新模型,我们提出了一种贪婪算法,近似地最小化了一个边缘错误的目标,并提供了双准则近似算法,其中第二个近似因子在预算上。此外,我们还解决了每个问题的参数复杂性,提供了FPT算法和难度结果。

作者:Alex Crane, Brian Lavallee, Blair D. Sullivan, and Nate Veldt

论文ID:2305.17598

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-05-30

PDF 下载: 英文版 中文版pdf翻译中