融合T5模型:统一文档排名信号以改进信息检索

摘要:融合Templated-based模型和全局注意力的重排序模型FiT5能够将文档文本信息、检索特征和全局文档信息整合成一个统一的模型。在MS MARCO和TREC DL的段落排序基准测试中,FiT5显著提高了排名性能。分析结果表明,通过全局注意力,FiT5能够逐渐关注相关文档,并改善对它们之间的微妙细微差异的检测。我们的代码将开源。

作者:Shi Yu (1), Chenghao Fan (2), Chenyan Xiong (3), David Jin (4), Zhiyuan Liu (1), Zhenghao Liu (5) ((1) Tsinghua University, (2) Huazhong University of Science and Technology, (3) Microsoft Research, (4) Massachusetts Institute of Technology, (5) Northeastern University)

论文ID:2305.14685

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-05-25

PDF 下载: 英文版 中文版pdf翻译中