大型语言模型中后门攻击的综述与通信网络内-arXiv论文预印本中文版

大型语言模型中后门攻击的综述与通信网络内

摘要：大型语言模型（LLM）由于其优越的语言理解和生成能力，已成为现代通信网络的重要组成部分。在这些网络环境中，由于受限的数据和计算资源，往往需要使用第三方数据和计算资源，因此后门攻击的风险变得非常重要。这些策略可能会使网络中的模型暴露于恶意操纵的训练数据和处理中，为攻击者嵌入隐藏的后门提供机会，这被称为后门攻击。LLMs中的后门攻击指的是在LLMs中嵌入隐藏的后门，使模型在良性样本上正常运行，但在有毒样本上性能下降。在可靠性和安全性至关重要的通信网络中，这个问题尤其令人关注。尽管对后门攻击进行了广泛的研究，但在通信网络中使用LLMs的特定环境下还缺乏深入探讨，而对这类攻击的系统性回顾当前也不存在。在本调查中，我们系统地提出了在通信网络中使用的LLMs中的后门攻击分类法，将其分为四大类别：输入触发、提示触发、指令触发和演示触发攻击。此外，我们对网络领域内的基准数据集进行了全面分析。最后，我们确定了潜在的问题和开放性挑战，为增强通信网络中LLMs的安全性和完整性提供了有价值的见解，并指出了未来研究的方向。

作者：Haomiao Yang, Kunlan Xiang, Hongwei Li and Rongxing Lu

论文ID：2308.14367

分类：Cryptography and Security

分类简称：cs.CR

提交时间：2023-08-29

PDF 下载： 英文版中文版pdf翻译中