多兴趣个性化推荐的密度加权-arXiv论文预印本中文版

多兴趣个性化推荐的密度加权

摘要：使用多个用户表示（MUR）来建模用户行为，而不是单个用户表示（SUR），已经证明可以提高推荐系统的个性化效果。然而，MUR带来的性能改进可能对物品和/或用户兴趣分布的偏斜性敏感。当数据分布高度倾斜时，学习多个表示的收益减少，因为模型在头部物品/兴趣上占主导地位，导致尾部物品的性能较差。因此，对于基于MUR的方法来说，对数据稀疏性的鲁棒性至关重要，以实现良好的推荐性能。然而，MUR和数据不平衡的研究主要是分开进行的。在本文中，我们深入探讨了从不平衡数据分布推断出的MUR的缺点。我们做出几个贡献：（1）使用合成数据集，我们演示了MUR对数据不均衡的敏感性；（2）为了改善尾部物品的MUR，我们提出了一种迭代密度加权方案（IDW），结合用户塔校准，以缓解针对长尾分布的训练对个性化的影响；（3）通过对三个实际基准测试的广泛实验，我们证明了IDW优于其他解决数据不平衡问题的替代方法。

作者：Nikhil Mehta, Anima Singh, Xinyang Yi, Sagar Jain, Lichan Hong and Ed H. Chi

论文ID：2308.01563

分类：Information Retrieval

分类简称：cs.IR

提交时间：2023-08-04

PDF 下载： 英文版中文版pdf翻译中