大数据集的p-均值曲线近似

摘要:用于拐线函数集的一组分段线性函数,称为折线,$P\_1,ldots,P\_L$分别具有最多$n$个顶点,可以简化为拐线$M$,其中$ k $个顶点,使得到每个折线的Fr''echet距离$ \epsilon\_1,ldots, \epsilon\_L $在$ L\_p $距离下最小化。我们将$ M $称为$ L\_p $,其中$ pgeq 1 $为$ p $-mean曲线($ p $-MC)。 我们将讨论$ pgeq 1 $,其中$ L\_p $距离满足三角不等式,并且$ p $-mean在大多数值$ p $之前尚未讨论过。对于$ L= Omega(1) $和某些值$ p $的情况,计算$ p $-mean折线是NP困难的,因此我们讨论近似算法。 对于$ L=2 $和$ pgeq 1 $,我们给出了一个$ O(n^2log k) $的时间精确算法。此外,我们将Fr''echet距离减少到离散Fr''echet距离,这在$ k $和$ \epsilon $上增加了一个因子$ 2 $。然后,我们使用我们的精确算法在$ operatorname {poly}(n,L) $时间内找到$ L>2 $的$ 3 $-近似值。我们的方法基于Fr''echet距离的自由空间图(FSD)的推广和适用于近似摘要的可组合核心集。

作者:Sepideh Aghamolaei and Mohammad Ghodsi

论文ID:2005.06672

分类:Computational Geometry

分类简称:cs.CG

提交时间:2021-08-30

PDF 下载: 英文版 中文版pdf翻译中