没有点击数据的情况下,对于长尾查询建模的感知相关性
摘要:使用点击数据在Web搜索中已经被用来估计文档和查询之间的相关性。由于在发出任何点击之前,用户只能感知到搜索结果的片段,因此点击所引发的相关性通常被称为“感知相关性”,在Web搜索中已被证明非常有用。虽然对于热门查询有大量的点击数据,但对于不受欢迎的长尾查询的信息却非常有限。这些长尾查询虽然占据了搜索量的很大一部分,但由于数据稀疏性,如有限的点击信息,这些查询的搜索准确性通常不能满意。在本文中,我们研究了如何为没有点击数据的查询建模感知相关性的问题。我们不依赖用户的点击数据,而是精心设计了一组片段特征,并使用它们来近似捕捉感知相关性。我们在两种情况下研究了这组片段特征的有效性:(1)预测感知相关性和(2)提高搜索引擎排名。实验结果表明,我们提出的模型能够有效预测Web搜索结果的相对感知相关性。此外,我们提出的片段特征可以有效提高没有点击数据的长尾查询的搜索准确性。
作者:Changsung Kang and Xiaotong Lin and Xuanhui Wang and Yi Chang and Belle Tseng
论文ID:1110.1112
分类:Information Retrieval
分类简称:cs.IR
提交时间:2011-10-07