面向基于超图增强学习的层次化对话推荐的策略学习
摘要:对话推荐系统(CRS)旨在通过对话及时主动地获取用户动态优先属性,以进行物品推荐。在CRS的每个轮次中,自然地有两个具有不同角色的决策过程相互影响:1)导演,选择更有效的后续选项(即询问或推荐)以减少行动空间并获取用户偏好;2)演员,相应地选择满足用户偏好的原始操作(即所问的属性或推荐的物品)并提供反馈,以估计导演选项的效果。然而,现有方法往往依赖于统一的决策模块或启发式规则,忽视了区分不同决策过程的角色以及它们之间的相互影响。为解决这个问题,我们提出了一种新颖的导演-演员层次对话推荐器(DAHCR),其中导演选择最有效的选项,然后演员相应地选择满足用户偏好的原始操作。具体而言,我们开发了一个动态超图来建模用户偏好,并引入内在动机以从导演的弱监督训练。最后,为了缓解模型偏差对导演和演员之间相互影响的不良影响,我们通过从分类分布中进行采样来建模导演的选项。大量实验证明,DAHCR优于最先进的方法。
作者:Sen Zhao, Wei Wei, Yifan Liu, Ziyang Wang, Wendi Li, Xian-Ling Mao, Shuai Zhu, Minghui Yang, Zujie Wen
论文ID:2305.02575
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-07-27