图卷积如何放大推荐中的流行度偏差?
摘要:图卷积网络(GCNs)因其在建模协同模式方面的优势而在推荐系统(RS)中变得流行。尽管提高了整体准确性,但GCNs不幸地放大了流行度偏差--尾部项目不太可能被推荐。这种效果阻碍了基于GCN的RS进行精确和公平的推荐,从而降低了推荐系统的长期效力。在本文中,我们研究了图卷积在RS中放大流行度偏差的方式。通过理论分析,我们确定了两个基本因素:(1)通过图卷积(即邻居聚合),热门项目对邻居用户的影响力大于尾部项目,使用户在表示空间中靠近热门项目;(2)经过多次图卷积后,热门项目会影响更多的高阶邻居,并变得更加有影响力。这两点使得热门项目更接近几乎所有用户,因此更频繁地被推荐。为了纠正这一点,我们提出了在每次图卷积后估计热门节点对每个节点表示的放大效应,并干预该效应。具体而言,我们采用聚类方法发现高度有影响力的节点,并估计每个节点的放大效应,然后在每个图卷积层中从节点嵌入中去除这种效应。我们的方法简单且通用--它可以在推理阶段用于纠正现有模型,而不是从头开始训练一个新模型,并且可以应用于各种GCN模型。我们在两个代表性的GCN骨干结构LightGCN和UltraGCN上演示了我们的方法,验证了其在提高尾部项目的推荐效果而不损害热门项目性能方面的能力。代码已开源(https://github.com/MEICRS/DAP)。
作者:Jiajia Chen, Jiancan Wu, Jiawei Chen, Xin Xin, Yong Li, Xiangnan He
论文ID:2305.14886
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-05-25