主成分分析的随机算法-arXiv论文预印本中文版

主成分分析的随机算法

摘要：主成分分析（PCA）需要计算一个包含正在分析的数据的矩阵的低秩近似。在许多PCA应用中，任何秩亏近似的最佳精度最多为几位数（以谱范数相对于被近似矩阵的谱范数测量）。在这种情况下，除非被近似矩阵的一个或两个维度较小，否则有效的算法不能保证有良好的精度。我们描述了一种有效的低秩近似矩阵的算法，该算法产生的精度非常接近最佳精度，适用于任意尺寸的矩阵。我们通过几个数值例子来说明我们的理论结果。

作者：Vladimir Rokhlin, Arthur Szlam, and Mark Tygert

论文ID：0809.2274

分类：Computation

分类简称：stat.CO

提交时间：2010-06-04

PDF 下载： 英文版中文版pdf翻译中