黎曼流形平滑嵌入的切空间估计
摘要:局部采样条件对于在数据分析中恢复低维模型或学习底层数据集中的流形是很重要的。许多流形学习方法需要从局部可用的数据样本中估计流形上某点处的切空间。局部采样条件,如(1)邻域大小(采样宽度)和(2)邻域中的样本数(采样密度),会影响学习算法的性能。在本文中,我们提出了一个理论分析,用于估计在n维欧几里得空间R^n中具有m维黎曼流形S上的点P处的切空间。假设S在R^n中光滑地嵌入,我们通过对从S上P的邻域中采样的点进行主成分分析(PCA)来估计切空间T_P S。我们的分析明确考虑了流形在P处的二阶性质,即主曲率以及更高阶的项。我们考虑了一个随机采样框架,并利用最近的随机矩阵理论结果推导出关于采样宽度和局部采样密度的条件,以便准确估计切子空间。我们通过估计切空间与真实切空间T_P S之间的夹角来度量估计的准确性,并给出该角度被有很高概率界定的条件。特别地,我们观察到局部采样条件非常依赖于流形的二阶局部逼近中各个分量的相关性。最后,我们提供了数值模拟来验证我们的理论发现。
作者:Hemant Tyagi, Elif Vural and Pascal Frossard
论文ID:1208.1065
分类:Computation
分类简称:stat.CO
提交时间:2013-05-20