CTR预测的再构建:学习推荐的不变特征交互

摘要:改进的点击率(CTR)预测在推荐系统中起着核心作用,作为为用户排名物品的最后一步筛选。解决CTR任务的关键是学习对预测有用的特征交互,通常通过与经验风险最小化(ERM)范式拟合历史点击数据来实现。代表性的方法包括因子分解机和深度兴趣网络,在工业应用中取得了广泛的成功。然而,这种方式不可避免地学习不稳定的特征交互,即在历史数据中展示强相关性但对未来服务的泛化能力较差的特征交互。在这项工作中,我们重新定义CTR任务,将历史数据按时间顺序划分为几个时期(也称为环境),旨在学习跨时期稳定的特征交互。这种特征交互应该更好地泛化到预测未来行为数据中。然而,一个技术挑战是现有的不变学习解决方案,如不变风险最小化,不适用,因为点击数据同时纠缠了环境不变和环境特定的相关性。为了解决这个困境,我们提出了解离不变学习(DIL),它将特征嵌入解离开来分别捕捉这两种类型的相关性。为了提高建模效率,我们进一步设计了LightDIL,在特征域的更高层次上进行解离。广泛的实验表明,DIL在学习CTR的稳定特征交互方面是有效的。我们发布了源代码 https://github.com/zyang1580/DIL。

作者:Yang Zhang, Tianhao Shi, Fuli Feng, Wenjie Wang, Dingxian Wang, Xiangnan He, Yongdong Zhang

论文ID:2304.13643

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-04-27

PDF 下载: 英文版 中文版pdf翻译中