嵌套嵌入式组合及其在异常值去除中的应用

摘要:离群值存在的欧几里得空间中嵌入的设计研究。给定度量空间(X, d)和整数k,目标是将除了k个点(称为“离群值”)之外的所有点都以最小的畸变c嵌入到ell_2中。对于给定的离群值集合大小k,寻找最佳畸变c,或者对于给定的目标畸变c,寻找最小的k都是NP难问题。实际上,即使度量函数去除离群值后能够保持同构嵌入到ell_2中,也很难以小于2的因子近似k。我们考虑了双标准的近似算法。我们的主要结果是一个多项式时间算法,可以在O(log^4 k)的因子内近似离群值集合大小,并且以一个常数因子内近似畸变。我们结果中的主要技术组件是一种构建两个给定嵌入的组合的方法,这些嵌入来自X的子集到ell_2中,并且在小的乘法因子内继承每个嵌入的畸变。具体来说,给定一个从S⊆X嵌入到ell_2中的低畸变c_S嵌入和一个从整个集合X嵌入到ell_2中的高畸变c_X嵌入,我们构建一个单一的嵌入,以实现相同的畸变c_S在S中的点对上,并且在其余点对上的扩展至多为O(log k) * c_X,其中k=|X\S|。我们的组合定理扩展到任意ell_p度量中的嵌入,可能具有独立的研究意义。尽管之前有研究过不相交集合上的嵌入的并集,但据我们所知,这是第一个研究嵌入的嵌套组合的工作。

作者:Shuchi Chawla and Kristin Sheridan

论文ID:2306.11604

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-07-12

PDF 下载: 英文版 中文版pdf翻译中