×

方向调整攻击

swMATH ID: 46079
软件作者: 杨向远;林杰;张汉林;杨新余;赵鹏
描述: 通过方向调整提高对抗性示例的可传递性。在基于传输的对抗性攻击中,对抗性示例仅由代理模型生成,并在受害者模型中实现有效扰动。虽然在提高基于传输的对抗性攻击生成的对抗性示例的可传输性方面已经做出了相当大的努力,但我们的调查发现,当前基于传输的对抗性攻击在实际和最陡峭的更新方向上的收敛速度偏差较大,这是由于更新步长较大造成的,导致生成的对抗性示例不能很好地收敛。然而,直接减少更新步长会导致严重的更新振荡,使得生成的对抗性示例也无法实现对受害者模型的良好可移植性。为了解决这些问题,提出了一种新的基于传输的攻击,即方向调整攻击,不仅可以减小大步长下实际更新方向与最陡更新方向之间的夹角,还可以缓解小采样步长下的更新振荡,从而使生成的对抗性示例能够很好地收敛,从而在受害者模型上实现很好的可移植性。具体来说,在我们的方向调整攻击中,我们首先使用大步长更新对手示例,这与以前的基于传输的攻击一致。此外,在更新的每个大步长中,通过使用小步长对多个示例进行采样。然后使用这些采样示例的平均梯度来减小实际更新方向和最陡更新方向之间的角度,并通过消除振荡分量来缓解更新振荡。通过这样做,我们的方向调整攻击可以实现更好的收敛性,并增强生成的对抗示例的可转移性。此外,还提出了一种网络剪枝方法来平滑决策边界,从而进一步减少更新振荡,增强生成的对抗性示例的可传递性。在ImageNet上的实验结果表明,与最新的基于梯度的攻击方法相比,该方法生成的对抗性示例的平均攻击成功率(ASR)在五种无防御的受害者模型上可以从87.9%提高到94.5%,在八种高级防御方法上可以从69.1%提高到76.2%。代码位于https://github.com/HaloMoto/DirectionTuning攻击.
主页: https://arxiv.org/abs/2303.15109
源代码:  https://github.com/HaloMoto/DirectionTuning攻击
依赖项: 蟒蛇
关键词: 对抗性攻击可转让性方向调谐网络修剪
相关软件: PyTorch公司
引用于: 0个文档

标准条款

1出版物描述软件,包括1出版物在zbMATH中 年份
通过方向调整提高对抗性示例的可传递性
杨向远;林杰;张汉林;杨新余;赵鹏
2023