攻击预训练推荐

摘要:在序列推荐中,最近一系列的先驱研究显示了预训练模型的效力,揭示了为不同下游推荐任务构建全知统一预训练推荐模型的路径。尽管有这些进展,但经典推荐系统的弱点在预训练推荐中仍然存在,而预训练推荐模型的安全性仍未开发,这可能威胁到其广泛的实际应用。在这项研究中,我们提出了一种针对预训练推荐的后门攻击的新框架。我们证明了预训练模型的提供者可以轻松地在预训练中插入后门,从而增加目标用户群体对目标项目的暴露率。具体来说,我们设计了两种新颖而有效的后门攻击:基本替换和提示增强,适用于不同的推荐预训练使用场景。在真实世界数据集上的实验结果显示,我们提出的攻击策略与清洁模型相比,显著提高了目标用户对目标项目的暴露率,达到数百倍。

作者:Yiqing Wu, Ruobing Xie, Zhao Zhang, Yongchun Zhu, FuZhen Zhuang, Jie Zhou, Yongjun Xu, Qing He

论文ID:2305.03995

分类:Information Retrieval

分类简称:cs.IR

提交时间:2023-05-09

PDF 下载: 英文版 中文版pdf翻译中