基于树的渐进回归模型在短视频推荐中的观看时间预测-arXiv论文预印本中文版

基于树的渐进回归模型在短视频推荐中的观看时间预测

摘要：一个准确的观看时长预测对于提高视频推荐系统中的用户参与至关重要。为了实现这一点，观看时长预测框架应满足四个特性：首先，尽管观看时长是连续值，但它也是一种有序变量，其值之间的相对顺序反映了用户偏好的差异。因此，观看时长预测应反映有序关系。其次，模型应捕捉到视频观看行为之间的条件依赖关系。例如，一个人在观看完整个视频之前必须先观看一半。第三，用点估计建模观看时长忽略了模型可能产生高不确定性结果的事实，这可能会导致推荐系统出现糟糕的情况。因此，该框架应关注预测的不确定性。第四，真实的推荐系统受到严重的偏差放大的影响，因此需要做到无偏差放大的估计。因此，我们提出了用于观看时长预测的TPM（Tree-based Predictive Modeling）方法。具体地，TPM将观看时长的有序排名引入模型，并将问题分解为一系列条件依赖的分类任务，这些任务组织成树状结构。通过遍历树，可以生成观看时长的期望，并将观看时长预测的方差明确地引入目标函数作为不确定性的度量。此外，我们还证明了TPM可以无缝地引入后门调整，从而减轻了偏差放大的问题。我们在公开数据集上进行了大量离线评估，并将TPM部署在拥有超过3亿日活用户的现实世界视频应用快手上。结果表明，TPM优于最先进的方法，并实际上显著提高了视频的消费情况。

作者：Xiao Lin, Xiaokai Chen, Linfeng Song, Jingwei Liu, Biao Li, Peng Jiang

论文ID：2306.03392

分类：Information Retrieval

分类简称：cs.IR

提交时间：2023-06-07

PDF 下载： 英文版中文版pdf翻译中