大规模共识聚类的高效相关聚类方法
摘要:共识聚类(或聚类集成)输入一个给定的基础集合V的k个分割,并试图创建一个最小化与所有输入分割不一致的单个分割。共识聚类的最先进算法基于相关聚类方法,如流行的Pivot算法。然而,这些方法在要么k要么V变大的共识聚类实例上并没有证明是实用的。在本文中,我们在V较大时为相关聚类求解器提供了实际的运行时间改进。我们将Pivot的时间复杂度从O(|V|^2 k)降低到O(|V| k),将其空间复杂度从O(|V|^2)降低到O(|V| k)--一个显著的节省,因为在实践中k远小于|V|。当k较大时,我们还分析了这些算法的抽样方法,弥合了在完整的输入分割集上运行Pivot(期望1.57近似)和随机选择一个输入分割(期望2近似)之间的差距。我们的实验证明,即使在输入分割的小样本上,像Pivot这样的算法在实践中也可以获得良好的聚类结果。
作者:Nathan Cordner and George Kollios
论文ID:2307.03818
分类:Data Structures and Algorithms
分类简称:cs.DS
提交时间:2023-07-11