攻击预训练推荐-arXiv论文预印本中文版

攻击预训练推荐

摘要：在序列推荐中，最近一系列的先驱研究显示了预训练模型的效力，揭示了为不同下游推荐任务构建全知统一预训练推荐模型的路径。尽管有这些进展，但经典推荐系统的弱点在预训练推荐中仍然存在，而预训练推荐模型的安全性仍未开发，这可能威胁到其广泛的实际应用。在这项研究中，我们提出了一种针对预训练推荐的后门攻击的新框架。我们证明了预训练模型的提供者可以轻松地在预训练中插入后门，从而增加目标用户群体对目标项目的暴露率。具体来说，我们设计了两种新颖而有效的后门攻击：基本替换和提示增强，适用于不同的推荐预训练使用场景。在真实世界数据集上的实验结果显示，我们提出的攻击策略与清洁模型相比，显著提高了目标用户对目标项目的暴露率，达到数百倍。

作者：Yiqing Wu, Ruobing Xie, Zhao Zhang, Yongchun Zhu, FuZhen Zhuang, Jie Zhou, Yongjun Xu, Qing He

论文ID：2305.03995

分类：Information Retrieval

分类简称：cs.IR

提交时间：2023-05-09

PDF 下载： 英文版中文版pdf翻译中