并行排序中的分区的最优轮次和样本大小复杂度
摘要:分布式内存体系结构的最先进的并行排序算法是基于使用抽样和直方图计算平衡分区。通过找到将排序键分成均匀大小块的样本,这些算法最小化所需的通信轮次。直方图计算(计算样本的位置)指导抽样,从而减少收集的样本总数。我们推导出计算平衡分区所需的抽样/直方图计算轮次的下界和上界。我们改进了先前的结果,证明当使用$p$个处理器时,$O(\log^* p)$轮且每轮$O(p/\log^* p)$个样本足够。我们与一个下界匹配,该下界表明任何每轮$O(p)$个样本的算法至少需要$Ω(\log^* p)$轮。另外,我们证明了一轮的$Ω(p \log p)$样本下界,从而证明了现有的一轮算法:样本排序、AMS排序和HSS具有最佳的样本大小复杂性。为了推导出这个下界,我们提出了一个困难的随机输入分布,并应用了运行的分布理论的经典结果。
作者:Wentao Yang, Vipul Harsh and Edgar Solomonik
论文ID:2204.04599
分类:Distributed, Parallel, and Cluster Computing
分类简称:cs.DC
提交时间:2023-05-30