学习多阶段多粒度语义嵌入用于电子商务搜索

摘要:从十亿级语料库中检索与用户查询匹配的相关项,构成了工业电子商务搜索系统的核心。在这些系统中,基于嵌入的检索(EBR)方法广泛应用。这些方法采用了一个双塔框架,分别学习查询和项的嵌入向量,从而利用高效的近似最近邻搜索来检索相关项。然而,现有的EBR方法通常忽视了工业多阶段搜索系统中不一致的用户行为,导致检索效率不足,商业回报率低。为了解决这个挑战,我们提出通过学习多级多粒度语义嵌入(MMSE)来改进EBR方法。我们提出了多阶段信息挖掘,利用实际用户行为数据中有序、点击、未点击和随机抽样的项,并通过后融合策略捕捉查询-项的相似性。然后,我们提出了多粒度学习目标,将检索损失与全局比较能力和排名损失与局部比较能力相结合,生成语义嵌入。在实际的十亿级数据集和在线A/B测试中的实验证明了MMSE在离线召回率和在线转化率(CVR)等指标上显著提升性能的有效性。

作者:Binbin Wang, Mingming Li, Zhixiong Zeng, Jingwei Zhuo, Songlin Wang, Sulong Xu, Bo Long, Weipeng Yan

论文ID:2303.11009

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-03-21

PDF 下载: 英文版 中文版pdf翻译中