CTR不足以满足需求:一种基于强化学习的新型排序方法,用于优化会话点击
摘要:推荐系统中的排序是一个关键模块。特别是在我们的YoungTao推荐场景中使用的排序模块是为了向用户提供一个有序的物品列表,以最大化每个用户在推荐会话中的点击数。然而,我们发现传统的优化点击率(CTR)的排序方法不能很好地适应我们的排序场景,因为它完全忽视了用户的离开,而CTR是一步推荐的优化目标。为了有效地实现我们排序模块的目的,我们提出了一个长期优化目标,称为CTE(点击量期望),明确考虑用户离开行为。基于CTE,我们提出了一个通过强化学习训练的有效模型。此外,我们根据离线日志数据构建了一个模拟环境,用于估计PBR和CTR。我们在离线数据集和淘宝的在线电子商务场景上进行了大量实验。实验结果表明,我们的方法可以有效地增强性能。
作者:Shaowei Liu, Yangjun Liu
论文ID:2308.14056
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-08-29