高维欧几里德最小生成树的大规模并行算法

摘要:在本文中,我们研究了在大规模并行计算(Massively Parallel Computation,MPC)模型中的经典欧几里得最小生成树(Euclidean Minimum Spanning Tree,MST)问题。给定一个包含n个点的集合X,目标是生成一个X的生成树,使其权重接近最优值。欧几里得MST是最基础的层次地理聚类算法之一,随着庞大的高维数据集(例如基于大型变压器的嵌入)的增加,对于有效的分布式算法来聚类这样的数据集存在着迫切的需求。 在低维空间(即d = O(1)),Andoni、Nikolov、Onak和Yaroslavtsev[STOC '14]提出了一种恒定轮次的MPC算法,获得了高精度的(1+ε)-近似解。然而在高维空间中,情况更具挑战性:目前已知的获得恒定近似度的最佳算法需要O(log n)轮次。最近,Chen、Jayaram、Levi和Waingarten [STOC '22]基于嵌入到树度量中给出了一种恒定轮次的约εO(log n)近似度算法。然而,到目前为止,没有已知的算法同时实现了恒定轮次和近似度。 本文通过在MPC模型的ildeO(log log n)轮次内给出一个恒定因子的近似度,对这个问题取得了强有力的进展。与基于树嵌入的方法必须支付Ω(log n)失真相比,我们的算法基于图形分布MST算法和几何空间划分的新组合。此外,尽管我们返回的近似MST可能有较大深度,但我们证明它可以修改为在MPC模型中对欧几里得旅行商问题(Euclidean Traveling Salesman Problem,TSP)进行恒定因子近似度的ildeO(log log n)轮次。先前,此问题只有O(log n)轮次的解法。

作者:Rajesh Jayaram, Vahab Mirrokni, Shyam Narayanan, Peilin Zhong

论文ID:2308.00503

分类:Data Structures and Algorithms

分类简称:cs.DS

提交时间:2023-08-02

PDF 下载: 英文版 中文版pdf翻译中