基于平方损失互信息的最大化信息聚类-arXiv论文预印本中文版

基于平方损失互信息的最大化信息聚类

摘要：信息最大化聚类通过无监督的方式学习一个概率分类器，使特征向量和聚类分配之间的互信息最大化。这种方法的一个明显优势是，它仅涉及模型参数的连续优化，相较于聚类分配的离散优化要容易得多。然而，现有方法仍然涉及非凸优化问题，因此在实践中要找到一个好的局部最优解并不简单。在本文中，我们提出了一种基于互信息的平方损失变体的另类信息最大化聚类方法。这种新颖的方法通过核特征值分解以一种计算高效的方式给出了聚类解决方案。此外，我们提供了一个实用的模型选择过程，可以客观地优化包含在核函数中的调参参数。通过实验证明了所提方法的实用性。

作者：Masashi Sugiyama, Makoto Yamada, Manabu Kimura, and Hirotaka Hachiya

论文ID：1112.0611

分类：Machine Learning

分类简称：stat.ML

提交时间：2011-12-06

PDF 下载： 英文版中文版pdf翻译中