噪声 k-means++ 重新审视

摘要:$k$-means ++算法在Arthur和Vassilvitskii的文章[SODA 2007]中已被证明是一个经典且经过时间验证的$k$-means问题算法。尽管非常实用,该算法也具有良好的理论保证:期望解的近似度为$O(\log k)$。 最近,Bhattacharya,Eube,Roglin和Schmidt [ESA 2020]考虑了以下问题:如果我们允许算法中的采样概率分布存在微小的对抗性噪声,该算法是否仍保持其保证?这可能是由于$k$-means++实现中使用的实数计算不精确造成的。令人惊讶的是,在这种情况下的分析变得更加困难,作者只能证明一个较弱的近似保证,即$O(\log^2 k)$。在本文中,我们通过提供一个紧致的,$O(\log k)$-近似保证,填补了这个差距。

作者:Christoph Grunau, Ahmet Alper "Oz"udou{g}ru, V''aclav Rozhov{n}

论文ID:2307.13685

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-07-26

PDF 下载: 英文版 中文版pdf翻译中