生成式检索作为稠密检索
摘要:生成检索是一种有前途的新型神经检索范例,旨在通过单个转换器模型同时执行索引和检索来优化检索流程。然而,这种新范例在更新索引和扩展到大规模集合方面面临挑战。在本文中,我们分析了两种显著变种的生成检索,并展示它们可以从概念上被视为稠密检索的双编码器。具体而言,我们分析地证明了生成检索过程可以分解为查询向量和文档向量之间的点积,类似于稠密检索。这种分析使我们提出了一种新的生成检索变种,称为Tied-Atomic,通过结合稠密检索的技术解决了更新和扩展问题。在NQ320k和完整的MSMARCO数据集上的实验中,我们确认这种方法不会降低检索效果,同时使模型能够扩展到大规模集合。
作者:Thong Nguyen, Andrew Yates
论文ID:2306.11397
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-06-21