高维数据秩的可扩展估计方法-arXiv论文预印本中文版

高维数据秩的可扩展估计方法

摘要：通过寻找一个信号丰富且低维的表示形式，是有效分析高维数据的一个重要挑战。对于线性子空间，通常通过将设计矩阵（通过特征值或奇异值分解）分解为正交分量，并保留那些具有足够变化的分量来实现这一目标。这相当于估计矩阵的秩，并且通常使用启发式或凭经验的方法来决定保留哪些分量，例如绘制特征值的递减序列，并寻找图上的“拐点”。尽管这些方法已被证明是有效的，但若拐点位置校准不良或估计错误，可能导致低维表示中的噪声过多或信号不足，从而使得后续建模变得困难。在本文中，我们提出了一种潜空间构建过程，通过保留其变化显著大于随机矩阵（其特征值遵循马尔钦科-帕斯图尔分布）的分量，来估计一个矩阵可检测信号空间的秩。

作者：Wenlan Zang, Jen-hwa Chu and Michael J. Kane

论文ID：2107.14426

分类：Computation

分类简称：stat.CO

提交时间：2021-08-02

PDF 下载： 英文版中文版pdf翻译中