计算机科学››2023,第50卷››发行(10): 362-368.数字对象标识:10.11896/jsjkx.220800090
•信息安全• 以前的文章 下一篇文章
赵子田、詹文翰、段汉聪、吴越
收到:
修订过的:
在线:
出版:
关于作者:
摘要:对抗性攻击的出现对在真实场景中大规模部署深层神经网络(DNN)构成了巨大威胁,尤其是在安全相关领域。现有的防御方法大多基于启发式假设,缺乏对模型鲁棒性的分析。如何提高DNN的鲁棒性,提高鲁棒性的可解释性和可信度,已经成为人工智能安全领域的一个重要组成部分。本文提出从奇异值的角度分析模型的鲁棒性。在对抗环境中,模型鲁棒性的提高伴随着奇异值的平滑分布。进一步分析表明,奇异值的平滑分布意味着该模型具有更多的分类置信源,从而具有更高的对抗鲁棒性。在此基础上,提出了一种基于奇异值抑制的对抗训练算法。实验表明,该算法提高了模型的鲁棒性,在面对强大的白盒攻击PGD(Project Gradient Descent)方法时,在CIFAR-10和SVHN上分别能达到55.3%和54.51%的准确率,超过了目前最具代表性的对抗训练方法。
关键词: 深度学习, 对抗性防守, 对抗性训练, 对手的稳健性, 奇异值分解
CLC编号:
赵子田、詹文翰、段汉聪、吴越。基于SVD的深度学习模型对抗稳健性研究[J]。计算机科学,2023,50(10):362-368。
0 / / 推荐
添加到引文管理器 尾注|样板客户经理|项目|BibTeX公司|参考Works
网址: https://www.jsjkx.com/EN/10.11896/jsjkx-220800090
https://www.jsjkx.com/EN/Y2023/V50/I10/362
引用