最优投影方差组稀疏分块主成分分析

摘要:一种组稀疏形式的主成分分析(PCA)定义问题的解决方法-或者等价的低秩逼近或字典学习问题-其在最大化分量所解释的方差和促进分量的稀疏性之间达到折衷。因此,我们首先提出了一个新的定义,即非正交分量解释的方差,它在某些方面是最优的,并且与主成分的情况是一致的。然后,我们使用该方差的一个特定正则化形式来定义PCA的群组稀疏最大方差(GSMV)形式。GSMV形式通过构造实现了我们的目标,并且具有内部非光滑优化问题可以解析求解的优点,因此将GSMV转化为在单位范数和正交性约束下、最大化一个平滑且凸函数的问题,这一问题推广了Journee等人(2010年)的群组稀疏性。与合成数据的放缩比较表明,GSMV对于检索隐藏的稀疏结构产生了稍微更好和更稳健的结果,并且在这些示例中快约三倍。在实际数据上的应用显示了群组稀疏性在混合数据的PCA中的变量选择的相关性。

作者:Marie Chavent, Guy Chavent

论文ID:1705.00461

分类:Machine Learning

分类简称:stat.ML

提交时间:2021-01-15

PDF 下载: 英文版 中文版pdf翻译中