白盒子成员推理攻击对抗扩散模型
摘要:扩散模型在工业应用中由于其出色的图像生成性能,已经开始超过GANs和其他生成模型。这些模型的复杂架构提供了广泛的攻击特征。鉴于此,我们旨在设计适用于扩散模型的成员推理攻击(MIAs)。我们首先对扩散模型上现有的MIAs进行了详尽的分析,考虑了诸如黑盒/白盒模型和攻击特征的选择等因素。我们发现,白盒攻击在实际场景中非常适用,目前最有效的攻击都是白盒攻击。与之前的研究不同的是,我们在白盒MIA中采用了模型梯度作为攻击特征,利用这些梯度可以更深入地了解模型对各种样本的响应。我们对这些模型进行了严格的测试,包括训练步骤、采样频率、扩散步骤和数据方差等一系列参数。无论在哪种实验设置下,我们的方法都表现出卓越的攻击性能,攻击成功率接近100%,攻击AUCROC接近1.0。我们还评估了我们的攻击对常见的防御机制,并观察到我们的攻击仍然表现出可观的性能。
作者:Yan Pang, Tianhao Wang, Xuhui Kang, Mengdi Huai, Yang Zhang
论文ID:2308.06405
分类:Cryptography and Security
分类简称:cs.CR
提交时间:2023-08-15