网络搜索结果的高效多样化

摘要:搜索结果多样化方法的效率分析 摘要:本文分析了不同搜索结果多样化方法的效率。虽然多样化方法的功效在过去得到了深入研究,但响应时间和可伸缩性问题很少被解决。因此,提出了一个用于研究结果多样化解决方案性能和可行性的统一框架。首先,我们定义了一种检测何时以及如何对查询结果进行多样化的新方法。为此,我们依靠“查询细化”的概念来估计查询具有歧义性的概率。然后,依靠这种新的歧义检测方法,我们在一个标准测试集上部署并比较了三种不同的多样化方法:IASelect,xQuAD和OptSelect。前两种方法是最新的最先进的提案,而后者是本文介绍的一种原始算法。我们通过使用标准TREC Web多样化跟踪测试平台来评估我们方法的效率和有效性。结果表明,OptSelect能够比其他两种最先进的方法运行快两个数量级,并且在多样化效果上获得可比较的结果。

作者:Gabriele Capannini (ISTI CNR), Franco Maria Nardini (ISTI-CNR), Raffaele Perego (ISTI-CNR), Fabrizio Silvestri (ISTI-CNR)

论文ID:1105.4255

分类:Information Retrieval

分类简称:cs.IR

提交时间:2011-05-24

PDF 下载: 英文版 中文版pdf翻译中