点击感知结构迁移与样本权重分配在后点击转化率估计中的应用
摘要:点击后转化率(CVR)预测任务在推荐和广告等工业应用中起着重要作用。传统的CVR方法通常面临数据稀疏问题,因为它们仅依赖用户点击的样本。为了解决这个问题,研究人员引入了多任务学习方法,利用未点击的样本,并与CTR任务共享特征表示。然而,应该注意到,CVR和CTR任务在本质上是不同的,甚至可能相互矛盾。因此,在没有区分的情况下引入大量CTR信息可能会淹没与CVR相关的有价值信息。本文将此现象称为知识诅咒问题。为了解决这个问题,我们认为在引入大量辅助信息和保护与CVR相关的有价值信息之间应该实现一个权衡。因此,我们提出了一种具有样本权重分配的点击感知结构转移模型(CSTWA)。它更加关注潜在的结构信息,可以过滤与CVR相关的输入信息,而不是直接共享特征表示。同时,为了捕捉CTR和CVR之间的表示冲突,我们校准表示层并重新权衡判别层,从CTR塔中挖掘点击偏差信息。此外,它还采用了一个偏向CVR建模的样本权重分配算法,以确保来自CTR的知识不会误导CVR。在工业和公共数据集上进行的大量实验证明,CSTWA明显优于广泛使用的竞争模型。
作者:Kai Ouyang, Wenhao Zheng, Chen Tang, Xuanji Xiao, Hai-Tao Zheng
论文ID:2304.01169
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-04-04