CPS-MEBR:面向多嵌入式检索的点击反馈感知网页摘要
摘要:基于嵌入的检索技术是一种利用嵌入表示查询和文档,然后将检索问题转换为嵌入空间中的最近邻搜索问题的技术。一些先前的研究主要集中在使用单个嵌入来表示网页,但在实际的网页搜索场景中,很难将长而复杂结构的网页的所有信息表示为单个嵌入。为了解决这个问题,我们设计了一种针对多嵌入检索的点击反馈感知的网页摘要(CPS-MEBR)框架,能够为网页生成多个嵌入以匹配不同的潜在查询。具体而言,我们利用搜索日志中用户的点击数据来训练一个摘要模型,提取那些用户经常点击的句子,这些句子更有可能回答那些潜在的查询。同时,我们引入句级语义交互来设计一个多嵌入检索(MEBR)模型,该模型可以使用网页中经常点击的句子生成多个嵌入来处理不同的潜在查询。离线实验表明,与单嵌入检索(SEBR)模型相比,它可以进行高质量的候选检索。
作者:Wenbiao Li, Pan Tang, Zhengfan Wu, Weixue Lu, Minghua Zhang, Zhenlei Tian, Daiting Shi, Yu Sun, Simiu Gu, Dawei Yin
论文ID:2210.09787
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-05-09