通过标准化聚类不稳定性估计聚类数量
摘要:改进了目前基于不稳定性的方法,用于选择聚类分析中的聚类数k,通过开发一种经过归一化的聚类不稳定性度量,纠正了聚类大小分布,这是以前未考虑的聚类不稳定性的驱动因素。我们展示了我们的归一化不稳定性度量在整个可能的k序列上的性能超过了目前基于不稳定性的度量,尤其是在大k的情况下克服了局限性。我们还首次比较了基于模型和无模型的方法来确定聚类不稳定性,并发现它们的性能相当。我们将我们的方法在R软件中提供。
作者:Jonas M. B. Haslbeck, Dirk U. Wulff
论文ID:1608.07494
分类:Machine Learning
分类简称:stat.ML
提交时间:2018-10-16