关于分段和折线的$k$-均值问题

摘要:$k$-means聚类问题在$mathbb{R}^{2}$空间中的直线片段上,使用Hausdorff距离进行研究。对于这个问题,我们提供了一个$(1+epsilon)$-近似算法,对于输入的$n$个片段,对于任何固定的$k$,以及具有恒定成功概率,运行时间为$O(n+ epsilon^{-O(k)} + epsilon^{-O(k)}cdot log^{O(k)}(epsilon^{-1}))$。该算法有两个主要组成部分。首先,我们将我们的度量空间中的$k$-means目标表示为代数函数的和,并使用Vigneron~cite{Vigneron14}的优化技术近似其最小值。其次,我们通过使用Feldman和Langberg~cite{Feldman11, Feldman2020}的基于敏感性的抽样框架计算小型核心集来减小输入大小。我们的结果可以推广到具有恒定复杂度的折线,运行时间为$O(n+ epsilon^{-O(k)})$。

作者:Sergio Cabello and Panos Giannopoulos

论文ID:2305.10922

分类:Computational Geometry

分类简称:cs.CG

提交时间:2023-05-19

PDF 下载: 英文版 中文版pdf翻译中