噪声 k-means++ 重新审视-arXiv论文预印本中文版

噪声 k-means++ 重新审视

摘要：$k$-means ++算法在Arthur和Vassilvitskii的文章[SODA 2007]中已被证明是一个经典且经过时间验证的$k$-means问题算法。尽管非常实用，该算法也具有良好的理论保证：期望解的近似度为$O(\log k)$。最近，Bhattacharya，Eube，Roglin和Schmidt [ESA 2020]考虑了以下问题：如果我们允许算法中的采样概率分布存在微小的对抗性噪声，该算法是否仍保持其保证？这可能是由于$k$-means++实现中使用的实数计算不精确造成的。令人惊讶的是，在这种情况下的分析变得更加困难，作者只能证明一个较弱的近似保证，即$O(\log^2 k)$。在本文中，我们通过提供一个紧致的，$O(\log k)$-近似保证，填补了这个差距。

作者：Christoph Grunau, Ahmet Alper "Oz"udou{g}ru, V''aclav Rozhov{n}

论文ID：2307.13685

分类：Data Structures and Algorithms

分类简称：cs.DS

提交时间：2023-07-26

PDF 下载： 英文版中文版pdf翻译中