随机数据集中推荐系统中的系统引起的偏见边界
摘要:消除偏见的随机数据集推荐在减少系统引起的偏见方面已经取得了非常有希望的结果。然而,与其他更为深入研究的无随机数据集的方法相比,它仍然缺乏更多的理论洞察或理想的优化目标函数。为了弥补这一差距,我们从一个新的角度研究了去偏问题,并提出直接最小化理想目标函数的上界,这有助于更好地解决系统引起的偏见问题。首先,我们利用随机数据集制定了一个新的理想优化目标函数。其次,根据一个采用的损失函数可能满足的先验约束,我们推导出两个不同的目标函数上界,即带有三角不等式的泛化误差上界和带有可分性的泛化误差上界。然后,我们证明了大多数现有的相关方法可以看作是对这两个上界的不充分优化。最后,我们提出了一种名为带有随机数据集的去偏近似上界(DUB)的新方法,它更充分地优化了这些上界。最后,我们对一个公共数据集和一个真实产品数据集进行了大量实验,以验证我们的DUB方法的有效性。
作者:Dugang Liu, Pengxiang Cheng, Zinan Lin, Xiaolian Zhang, Zhenhua Dong, Rui Zhang, Xiuqiang He, Weike Pan, Zhong Ming
论文ID:2303.11574
分类:Information Retrieval
分类简称:cs.IR
提交时间:2023-03-22