核偏最小二乘回归速度加快的Lanczos近似

摘要:用于计算拟合的Kernel Partial Least Squares(KPLS)运行时间随样本数量呈二次增长。然而,为了进行模型选择的自由度敏感度测量或更详细分析的置信区间,需要三次运行时间,因此成为现实数据分析中的计算瓶颈。我们提出了一种新算法,用于KPLS,它不仅可以在二次运行时间内计算(a)拟合度,还可以计算(b)其近似自由度和(c)误差范围。该算法利用了Kernel PLS与用于近似对称矩阵特征值的Lanczos算法之间的紧密联系,并用此近似值来计算二次运行时间内的核矩阵幂的痕迹。

作者:Nicole Kraemer, Masashi Sugiyama, Mikio Braun

论文ID:0902.3347

分类:Machine Learning

分类简称:stat.ML

提交时间:2010-08-13

PDF 下载: 英文版 中文版pdf翻译中