稀疏神经检索器的静态修剪研究

摘要:稀疏神经信息检索器,如DeepImpact、uniCOIL和SPLADE,最近作为一种高效和有效的倒排索引检索方法被引入。它们旨在学习术语的重要性,并在某些情况下进行文档扩展,以提供比传统的词袋模型检索(如BM25)更有效的文档排名。然而,与经典对应物相比,这些稀疏神经信息检索器已经显示出增加了查询处理的计算成本和延迟。为了减轻这个问题,我们采用了提高倒排索引查询处理效率的一组著名技术:静态修剪。我们尝试了三种静态修剪策略,即以文档为中心、以术语为中心和不考虑策略,并且我们通过不同的数据集评估了这些技术在稀疏神经信息检索器上的工作效果。特别是,静态修剪实现了2倍的加速,效果损失可以忽略不计(降低不超过2%),并且根据使用情况,甚至可以实现4倍的加速,对效果影响最小(降低不超过8%)。此外,我们展示了神经重新排序器对静态修剪索引的候选项是稳健的。

作者:Carlos Lassance, Simon Lupart, Herv''e Dejean, St''ephane Clinchant, Nicola Tonellotto

论文ID:2304.12702

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-04-26

PDF 下载: 英文版 中文版pdf翻译中