从正无标签隐式反馈中消除偏差的成对学习

摘要:从成对比较中学习对比表示在自然语言处理、计算机视觉和信息检索等各个领域取得了显着的成功。基于成对学习的协同过滤算法也源于这一范式。一个重要的问题是,隐式反馈数据中缺少负实例的标签,这往往导致随机选择的负实例包含错误的负实例,进而产生有偏的嵌入。为了解决这个问题,我们引入了一种用于采样偏差校正的新方法,该方法产生了一种名为去偏差成对损失(DPL)的修改损失函数。DPL的关键思想是校正由错误的负实例造成的有偏概率估计,从而校正梯度以近似全监督数据的梯度。DPL的实施只需要对代码进行小的修改。对五个公开数据集的实验证明了所提出的学习方法的有效性。

作者:Bin Liu and Qin Luo and Bang Wang

论文ID:2307.15973

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-08-01

PDF 下载: 英文版 中文版pdf翻译中