面向基于超图增强学习的层次化对话推荐的策略学习-arXiv论文预印本中文版

面向基于超图增强学习的层次化对话推荐的策略学习

摘要：对话推荐系统（CRS）旨在通过对话及时主动地获取用户动态优先属性，以进行物品推荐。在CRS的每个轮次中，自然地有两个具有不同角色的决策过程相互影响：1）导演，选择更有效的后续选项（即询问或推荐）以减少行动空间并获取用户偏好；2）演员，相应地选择满足用户偏好的原始操作（即所问的属性或推荐的物品）并提供反馈，以估计导演选项的效果。然而，现有方法往往依赖于统一的决策模块或启发式规则，忽视了区分不同决策过程的角色以及它们之间的相互影响。为解决这个问题，我们提出了一种新颖的导演-演员层次对话推荐器（DAHCR），其中导演选择最有效的选项，然后演员相应地选择满足用户偏好的原始操作。具体而言，我们开发了一个动态超图来建模用户偏好，并引入内在动机以从导演的弱监督训练。最后，为了缓解模型偏差对导演和演员之间相互影响的不良影响，我们通过从分类分布中进行采样来建模导演的选项。大量实验证明，DAHCR优于最先进的方法。

作者：Sen Zhao, Wei Wei, Yifan Liu, Ziyang Wang, Wendi Li, Xian-Ling Mao, Shuai Zhu, Minghui Yang, Zujie Wen

论文ID：2305.02575

分类：Information Retrieval

分类简称：cs.IR

提交时间：2023-07-27

PDF 下载： 英文版中文版pdf翻译中