关于分段和折线的$k$-均值问题
摘要:$k$-means聚类问题在$mathbb{R}^{2}$空间中的直线片段上,使用Hausdorff距离进行研究。对于这个问题,我们提供了一个$(1+epsilon)$-近似算法,对于输入的$n$个片段,对于任何固定的$k$,以及具有恒定成功概率,运行时间为$O(n+ epsilon^{-O(k)} + epsilon^{-O(k)}cdot log^{O(k)}(epsilon^{-1}))$。该算法有两个主要组成部分。首先,我们将我们的度量空间中的$k$-means目标表示为代数函数的和,并使用Vigneron~cite{Vigneron14}的优化技术近似其最小值。其次,我们通过使用Feldman和Langberg~cite{Feldman11, Feldman2020}的基于敏感性的抽样框架计算小型核心集来减小输入大小。我们的结果可以推广到具有恒定复杂度的折线,运行时间为$O(n+ epsilon^{-O(k)})$。
作者:Sergio Cabello and Panos Giannopoulos
论文ID:2305.10922
分类:Computational Geometry
分类简称:cs.CG
提交时间:2023-05-19