正则化张量分解与高阶主成分分析
摘要:高维张量或多路数据在生物医学成像、化学计量学、网络和文献计量学等领域越来越普遍。传统的降维张量数据表示方法包括将数据展平并应用矩阵因子分解如主成分分析(PCA),或者使用CANDECOMP/PARAFAC (CP)和Tucker分解等张量分解方法。前者可能会丢失数据中的重要结构,而后者在高维度和许多无关特征的情况下可能存在问题。我们介绍了基于启发式算法方法的稀疏张量分解或稀疏HOPCA的框架,并通过解CP分解相关的惩罚优化问题来解决这些问题。这些方法的扩展导致了一般正则化张量因子分解方法、多路功能HOPCA以及结构化数据的HOPCA的推广。我们通过对模拟数据和多维微阵列和功能性MRI的信号恢复进行实证研究,证明了我们方法在降维、特征选择和信号恢复上的实用性。
作者:Genevera I. Allen
论文ID:1202.2476
分类:Machine Learning
分类简称:stat.ML
提交时间:2012-02-14