跨领域增强网络用于点击率预测
摘要:基于异构输入的跨域增强网络:针对点击率(CTR)预测中的数据稀疏问题,尤其是在用户-项目交互过于稀疏以致无法学习可靠模型的情况下,近期已经提出了许多关于跨域CTR预测的研究,旨在利用相关领域的有意义数据。然而,大多数现有的跨域CTR研究都存在一个不切实际的限制,即要求领域之间具有同质输入(即共享特征字段),而跨域CTR中领域之间具有异质输入(即变化的特征字段)的问题尚未广泛探讨,但是这是一个紧迫且重要的研究问题。在这项工作中,我们提出了一种能够在具有异质输入的两个领域之间进行知识转移的跨域增强网络(CDAnet)。具体而言,CDAnet包含一个设计好的翻译网络和一个增强网络,这两个网络是顺序训练的。翻译网络能够通过设计两个独立的分支,分别计算具有异质输入的两个领域的特征,并使用设计好的跨监督特征转换器学习有意义的跨域知识。然后,增强网络通过在潜在空间中执行的特征翻译对学到的跨域知识进行编码,并对最终的CTR预测模型进行微调。通过在两个公共基准数据集和一个工业生产数据集上进行广泛实验,我们表明CDAnet可以学习到有意义的转换特征,并大幅提高CTR预测性能。在淘宝应用的图像到商品检索的在线A/B测试中,CDAnet带来了绝对0.11个CTR改善和相对1.26%的GMV增长。
作者:Xu Chen and Zida Cheng and Shuai Xiao and Xiaoyi Zeng and Weilin Huang
论文ID:2305.03953
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-05-10