高维数据的高效lα距离近似:使用α稳定投影

摘要:应用于科学和商业领域的大型高维数据集已经变得普遍。在统计分析中,降维技术是一个主要关注点。投影方法发挥着重要的作用。本文研究利用alpha稳定分布的特性的投影算法。我们展示了利用L-估计可以从随机投影中恢复l_alpha距离和准距离,并且具有统计效率。我们的算法计算要求适度;在对一个长度为k的数组进行一次性计算之后,算法以O(k)的时间运行每个距离,其中k是投影的降维后的维数。

作者:Peter Clifford and Ioana A. Cosma

论文ID:0801.3559

分类:Computation

分类简称:stat.CO

提交时间:2008-01-24

PDF 下载: 英文版 中文版pdf翻译中