Tenrec:一个用于推荐系统的大规模多功能基准数据集

摘要:面向推荐系统的现有基准数据集要么规模较小,要么仅涉及非常有限的用户反馈形式。在这篇论文中,我们描述了Tenrec,这是一个新颖且公开可用的推荐系统数据集,记录了来自四种不同推荐场景的各种用户反馈。具体而言,Tenrec具有以下五个特点:(1)规模大,包含约500万用户和1.4亿次交互;(2)不仅有正向用户反馈,还有真实的负向反馈(与单类推荐相比);(3)包含在四个不同场景中重叠的用户和物品;(4)包含各种类型的用户正向反馈,如点击、喜欢、分享、关注等;(5)包含除用户ID和物品ID之外的其他特征。我们通过对每个任务运行几个经典基准模型来验证Tenrec在十个不同的推荐任务上的性能。Tenrec有潜力成为大多数热门推荐任务的有用基准数据集。

作者:Guanghu Yuan, Fajie Yuan, Yudong Li, Beibei Kong, Shujie Li, Lei Chen, Min Yang, Chenyun Yu, Bo Hu, Zang Li, Yu Xu, Xiaohu Qie

论文ID:2210.10629

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-06-06

PDF 下载: 英文版 中文版pdf翻译中