主成分分析的随机算法
摘要:主成分分析(PCA)需要计算一个包含正在分析的数据的矩阵的低秩近似。在许多PCA应用中,任何秩亏近似的最佳精度最多为几位数(以谱范数相对于被近似矩阵的谱范数测量)。在这种情况下,除非被近似矩阵的一个或两个维度较小,否则有效的算法不能保证有良好的精度。我们描述了一种有效的低秩近似矩阵的算法,该算法产生的精度非常接近最佳精度,适用于任意尺寸的矩阵。我们通过几个数值例子来说明我们的理论结果。
作者:Vladimir Rokhlin, Arthur Szlam, and Mark Tygert
论文ID:0809.2274
分类:Computation
分类简称:stat.CO
提交时间:2010-06-04