衡量因果解缠对神经网络模型的敌对稳健性的影响

摘要:因果神经网络模型显示出对抗攻击的高鲁棒性以及与传统神经网络相比在少样本学习和罕见场景分类等概括任务上的增强能力。这种鲁棒性被认为源于因果关系和混淆输入信号的解缠合。然而,迄今为止还没有定量研究测量这些类型的因果模型实现的解缠合水平,以及如何与其对抗攻击的鲁棒性相关。 现有的因果解缠合度量标准不适用于在真实世界数据集上训练的确定性模型。因此,我们利用计算机视觉领域的内容/风格解缠合度量标准来测量四种最先进的因果神经网络模型的不同因果解缠合方面。通过使用相同的ResNet18架构重新实现这些模型,我们能够公平地测量它们在三个标准图像分类基准数据集上对七种常见白盒攻击的鲁棒性。我们发现因果模型在解缠因果与混淆信号方面的程度与其对抗攻击的鲁棒性之间存在强相关性 (r=0.820, p=0.001)。此外,我们发现混淆信号的像素级信息内容与对抗鲁棒性之间存在中等的负相关性 (r=-0.597, p=0.040)。

作者:Preben M. Ness, Dusica Marijan, Sunanda Bose

论文ID:2308.10708

分类:Machine Learning

分类简称:cs.LG

提交时间:2023-08-22

PDF 下载: 英文版 中文版pdf翻译中