二进制关系连接的近似最佳并行算法

摘要:用于评估自然连接的大规模并行计算(MPC)模型中的恒定轮次算法。我们的算法实现了$\tilde{O}(m/p^{1/\rho})$的负载,其中$m$是输入关系的总大小,$p$是计算机的数量,$\rho$是连接的分数边覆盖数,$\tilde{O}(.)$隐藏了一个对数因子。负载与已知下界相匹配,最多差一个对数因子。所提出的算法的核心是一个新的定理(我们将其命名为"隔离的笛卡尔积定理"),它提供了对问题数学结构的新见解。我们的结果意味着,在MPC模型中,可以最优地解决子图枚举问题,其中目标是报告所有常量大小的子图模式的出现情况(最多差一个对数因子)。

作者:Bas Ketsman, Dan Suciu, and Yufei Tao

论文ID:2011.14482

分类:Databases

分类简称:cs.DB

提交时间:2023-06-22

PDF 下载: 英文版 中文版pdf翻译中