使用伪集群选择和投票技术的在线论坛主题检索

摘要:线上论坛促进了网络上的知识寻求和分享。然而,由于信息过载,共享的知识没有充分利用。线程检索是一种克服信息过载的方法。在本文中,我们提出了一个模型,将两种现有方法结合起来:伪聚类选择和投票技术。在这两种方法中,检索系统首先对一系列消息进行评分,然后通过汇总评分的消息来对线程进行排序。它们在聚合的内容和方法上有所不同。伪聚类选择侧重于输入,而投票技术侧重于聚合方法。我们的组合模型注重输入和聚合方法。结果表明,一些组合模型在统计上优于基准方法。

作者:Ameer Tawfik Albaham, Naomie Salim

论文ID:1212.5590

分类:Information Retrieval

分类简称:cs.IR

提交时间:2012-12-27

PDF 下载: 英文版 中文版pdf翻译中