通过截断的希尔伯特空间展开进行信息检索
摘要:在文档集合中,除了词项的频率之外,词项的分布对于确定文档的相关性也起着重要作用。本文提出了一种表示文档中词项位置的新方法。该方法允许在查询评估时高效评估词项位置信息。本文研究了三种应用:基于函数的评分优化,代表用户定义的文档区域;基于重叠排列词项分布的查询扩展技术,在排名靠前的文档中进行;以及对文档中词项进行聚类分析。实验结果证明了所提方法的有效性。
作者:Patricio Galeas, Ralph Kretschmer and Bernd Freisleben
论文ID:0910.1938
分类:Information Retrieval
分类简称:cs.IR
提交时间:2009-10-13