从视频推荐中的有偏见和噪声的观看时间中揭示用户兴趣

摘要:视频推荐中,观看时间通常被作为用户兴趣的指标。然而,观看时间不仅受到用户兴趣匹配的影响,还受到其他因素的影响,如时长偏差和嘈杂观看。时长偏差指的是用户倾向于在视频时长较长的情况下花费更多时间,而不考虑其实际兴趣水平。另一方面,嘈杂观看描述的是用户花时间来确定他们是否喜欢一个视频,这可能导致用户花费时间观看他们不喜欢的视频。因此,时长偏差和嘈杂观看的存在使得观看时间成为不适当的指标来表示用户兴趣。此外,目前的方法主要解决时长偏差问题,忽视了嘈杂观看的影响,这可能限制了从观看时间中挖掘用户兴趣的效果。在本研究中,我们首先从统一因果视角分析了用户观看时间的生成机制。具体而言,我们将观看时间视为用户实际兴趣水平、时长偏差观看时间和嘈杂观看时间的混合。为了减轻时长偏差和嘈杂观看的影响,我们提出了修正偏差和去噪观看时间(D$^2$Co)的方法,分为两个步骤:首先,我们使用基于时长的高斯混合模型和频率加权移动平均来估计偏差和噪声项;然后,我们利用一个灵敏度控制的修正函数来将用户兴趣从观看时间中分离出来,这对于偏差和噪声项的估计误差具有鲁棒性。在两个公共视频推荐数据集和在线A/B测试上的实验证明了所提出方法的有效性。

作者:Haiyuan Zhao, Lei Zhang, Jun Xu, Guohao Cai, Zhenhua Dong, Ji-Rong Wen

论文ID:2308.08120

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-08-17

PDF 下载: 英文版 中文版pdf翻译中