随机输入模型中的最大交集查询

摘要:如何快速找到与查询集的交集最大的家族成员?查询和预处理时间的约束使得这个问题具有挑战性。最大交集查询在广泛的应用中出现,包括网络搜索、推荐系统和在线广告分发。一般来说,最大交集查询是计算开销大的。我们研究了所有集合族的两种有动机的分布,并提出了针对每种分布的算法。我们证明,在非常高的概率下,可以在与家族大小对数成比例的时间内找到一个接近最优解的解决方案。此外,我们指出了我们两个输入模型中交集概率的一个阈值现象,它导致了上述高效算法。

作者:Benjamin Hoffmann, Mikhail Lifshits, Yury Lifshits, Dirk Nowotka

论文ID:1004.0092

分类:Information Retrieval

分类简称:cs.IR

提交时间:2010-04-02

PDF 下载: 英文版 中文版pdf翻译中