高维曲线的随机投影
摘要:高维数据集要求现代时间序列分析具备处理能力。例如,在气候学中,需要考虑来自众多传感器的测量数据;或者在大型商场的库存追踪中,维度由追踪物品的数量定义。处理高维数据引发的计算问题的标准方法是应用某种保留环境空间结构性质的降维技术。两个时间序列之间的相异性通常通过“离散”距离来衡量,例如动态时间规整或者离散的 Fréchet 距离。由于所有这些距离函数都直接计算时间序列的数据点,它们对于不同的采样率或者间隔是敏感的。连续的 Fréchet 距离提供了一种流行的选择,通过考虑由线性插值在任意两个连续点之间得到的多边形曲线上的所有点来缓解这个问题。 我们研究了 Johnson 和 Lindenstrauss 的随机投影方法如何有效降低维度并保持多边形曲线的连续 Fréchet 距离。特别地,我们证明可以将维度降低到 $O(\epsilon^{-2} \log N)$,其中 $N$ 是总的输入数据点的数量,同时在 $1 \pm \epsilon$ 的因子内保持任意两个确定的多边形曲线的连续 Fréchet 距离。最后,我们给出了在聚类方面的应用。
作者:Ioannis Psarros and Dennis Rohde
论文ID:2207.07442
分类:Computational Geometry
分类简称:cs.CG
提交时间:2023-02-15