学习通过相关性进行混合-arXiv论文预印本中文版

学习通过相关性进行混合

摘要：各种垂直搜索引擎的兴起突显出单一的排名技术无法处理复杂和规模庞大的搜索问题的事实。例如，视频和图片搜索背后的技术与一般网络搜索非常不同。它们的排名函数共享一些特征。问答网站（例如，Yahoo！问答）可以利用为一般网页开发的文本匹配和点击特征，但它们具有独特的页面结构和丰富的用户反馈，例如，Yahoo！回答中的赞和踩评分，这对它们自己的排名非常有益处。即使是那些回答和一般网页共享的特征，特征与相关性之间的关联可能非常不同。因此，需要专用功能来更好地对个别领域内的文档进行排名。这些专用函数在不同的特征空间上定义。然而，为每个领域都有一个搜索框既不高效也不可扩展。与其将相同的查询输入两次，分别在Yahoo！搜索和Yahoo！回答中检索两个排名列表，我们更倾向于只输入一次，但在该主题的两个领域中都收到一份全面的文档列表。这种情况需要将来自不同来源的文档融合到一个排名列表中的新技术。尽管融合列表的内容丰富，但它仍然必须按相关性进行排序。我们称这种技术为融合，这是本文的主要内容。

作者：Jiang Chen, Wei Chu, Zhenzhen Kou, Zhaohui Zheng

论文ID：1001.4597

分类：Information Retrieval

分类简称：cs.IR

提交时间：2010-09-24

PDF 下载： 英文版中文版pdf翻译中