多兴趣个性化推荐的密度加权

摘要:使用多个用户表示(MUR)来建模用户行为,而不是单个用户表示(SUR),已经证明可以提高推荐系统的个性化效果。然而,MUR带来的性能改进可能对物品和/或用户兴趣分布的偏斜性敏感。当数据分布高度倾斜时,学习多个表示的收益减少,因为模型在头部物品/兴趣上占主导地位,导致尾部物品的性能较差。因此,对于基于MUR的方法来说,对数据稀疏性的鲁棒性至关重要,以实现良好的推荐性能。然而,MUR和数据不平衡的研究主要是分开进行的。在本文中,我们深入探讨了从不平衡数据分布推断出的MUR的缺点。我们做出几个贡献:(1)使用合成数据集,我们演示了MUR对数据不均衡的敏感性;(2)为了改善尾部物品的MUR,我们提出了一种迭代密度加权方案(IDW),结合用户塔校准,以缓解针对长尾分布的训练对个性化的影响;(3)通过对三个实际基准测试的广泛实验,我们证明了IDW优于其他解决数据不平衡问题的替代方法。

作者:Nikhil Mehta, Anima Singh, Xinyang Yi, Sagar Jain, Lichan Hong and Ed H. Chi

论文ID:2308.01563

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-08-04

PDF 下载: 英文版 中文版pdf翻译中