探索文档和查询的多维表示(扩展版)

摘要:将查询和文档表示为向量在信息检索(IR)中时常被使用,无论是显性还是隐性。然而,将文档和/或查询看作多维对象可能更有益。我们认为这将允许构建“真正”互动的IR系统,即将互动完全纳入IR框架中。量子物理学的概率形式主义将事件和密度表示为多维对象。本文介绍了我们构建一个基于这个形式主义的互动IR框架的第一步,即说明了检索过程的第一次互动,即当用户输入一个查询时,可如何形式化。我们的框架依赖于一些影响最终文档排名的参数。在本文中,我们实验性地研究了这些参数的影响,显示了提议的将文档和查询表示为多维对象的方法可以与标准方法竞争,并有额外的前景应用于互动检索。

作者:Benjamin Piwowarski and Ingo Frommholz and Mounia Lalmas and Keith van Rijsbergen

论文ID:1002.3238

分类:Information Retrieval

分类简称:cs.IR

提交时间:2010-02-18

PDF 下载: 英文版 中文版pdf翻译中