高维多视图预测分区
摘要:多视角预测分区(MVPP)的数据聚类算法:一种基于数据点之间预测相似性的新颖算法。我们假设在每个簇内,多变量视图之间的依赖关系可以通过使用双块偏最小二乘(TB-PLS)回归模型来建模,该模型对高维数据特别适用。所提出的MVPP算法通过使得视图之间的簇内预测能力最大化来对数据进行分区。所提出的目标函数依赖于在TB-PLS模型下的点的预测影响度度量,该度量是对普通最小二乘回归中常用的PRESS统计量的扩展。通过使用模拟数据,我们将MVPP的性能与依赖于点的几何结构但忽略两个视图之间预测关系的竞争多视图聚类方法进行了比较。在基准网络挖掘数据集上获得了最先进的结果。
作者:Brian McWilliams and Giovanni Montana
论文ID:1202.0825
分类:Machine Learning
分类简称:stat.ML
提交时间:2012-02-07