0

0

论文阅读:对抗训练(Adversarial Training)

絕刀狂花

絕刀狂花

发布时间:2025-10-01 09:41:13

|

384人浏览过

|

来源于php中文网

原创

  1. 引言

对抗训练(adversarial training)是一种增强神经网络鲁棒性的有效方法。在对抗训练过程中,样本会加入微小的扰动(虽然改变很小,但可能导致误分类),以使神经网络适应这些变化,从而增强对对抗样本的抵抗力。

在图像领域,采用对抗训练通常可以提高模型的鲁棒性,但往往会降低其泛化能力,即虽然对抗样本的抵抗力增强了,但可能影响到普通样本的分类性能。然而,在语言模型领域却观察到不同的现象——对抗训练不仅提升了鲁棒性,还增强了泛化能力。因此,对抗训练仍值得进一步研究,因为它确实能提升模型的性能。

首先,我们来探讨对抗训练的一般原理。对抗训练可以概括为以下最大最小化公式:

论文阅读:对抗训练(Adversarial Training)论文阅读:对抗训练(Adversarial Training)2. FGSM/FGM方法论文阅读:对抗训练(Adversarial Training)3. PGD方法论文阅读:对抗训练(Adversarial Training)4. FreeAT(Free Adversarial Training)在PGD的计算过程中,每次进行前向和后向计算时,无论是参数的梯度还是输出的梯度都会被计算出来。然而,在梯度下降过程中只使用参数的梯度,而在梯度提升过程中只使用输入的梯度,这实际上是一种浪费。我们能否在一次前向后向计算中同时利用参数的梯度和输入的梯度?这就是FreeAT[4]文章的核心思想。

具体如何实现呢?这里有一个小问题,即普通训练与PGD对抗训练的方式略有不同。普通训练中相邻的batch是不同的,而PGD对抗训练在计算梯度提升时,需要对同一个mini-batch的样本反复求梯度。FreeAT仍然采用PGD这种训练方式,即对于每个mini-batch的样本会求K次梯度,每次求得的梯度既用来更新扰动,也用来更新参数。原始的PGD训练方法,每次内层计算只用梯度来更新扰动,等K步走完后才重新计算一次梯度,更新参数。这种不同可以通过下图形象地表示。

论文阅读:对抗训练(Adversarial Training)需要注意的是,如果内层进行K次迭代,对于外层计算,FreeAT会将总体的迭代epoch除以K,以保证总体的梯度计算次数与普通训练相同。从外层训练的角度来看,每个mini-batch被训练的次数与普通训练相同,只是训练顺序有所变化,K个相同的mini-batch会被顺序训练。这样做带来的问题是连续相同的mini-batch对参数更新的扰动不如随机mini-batch大,这可能影响模型最终的收敛效果。但论文通过实验证明,这种担忧是多余的。详细的算法代码如下:

论文阅读:对抗训练(Adversarial Training)5. YOPO(You can Only Propagate Once)YOPO[5]的出发点是利用神经网络的结构来减少梯度计算的计算量。从PMP(Pontryagin's maximum principle)的角度来看,对抗扰动只与神经网络的第一层有关。因此,论文提出固定前面的基层,只对第一层求梯度,并据此来更新扰动。

基于这一想法,作者考虑复用后几层的梯度,假设p为定值:

论文阅读:对抗训练(Adversarial Training)则对扰动的更新可以变为:

文心快码
文心快码

文心快码(Comate)是百度推出的一款AI辅助编程工具

下载

论文阅读:对抗训练(Adversarial Training)详细的算法代码如下:

论文阅读:对抗训练(Adversarial Training)尽管YOPO-m-n只完成了m次完整的正反向传播,但却实现了mn次扰动的更新。而PGD-r算法完成r次完整的正反向传播只能实现r次扰动的更新。从这个角度看,YOPO-m-n算法的效率明显更高,而实验也表明,只要使得mn略大于r,YOPO-m-n的效果就能与PGD-r相媲美。

  1. FreeLB(Free Large Batch Adversarial Training)论文阅读:对抗训练(Adversarial Training)论文阅读:对抗训练(Adversarial Training)7. 参考文献[1] EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES

[2] ADVERSARIAL TRAINING METHODS FOR SEMI-SUPERVISED TEXT CLASSIFICATION

[3] Towards Deep Learning Models Resistant to Adversarial Attacks

[4] Adversarial Training for Free!

[5] You Only Propagate Once: Accelerating Adversarial Training via Maximal Principle

[6] FREELB: ENHANCED ADVERSARIAL TRAINING FOR NATURAL LANGUAGE UNDERSTANDING

相关专题

更多
页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

403

2023.08.14

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

23

2026.01.19

java用途介绍
java用途介绍

本专题整合了java用途功能相关介绍,阅读专题下面的文章了解更多详细内容。

15

2026.01.19

java输出数组相关教程
java输出数组相关教程

本专题整合了java输出数组相关教程,阅读专题下面的文章了解更多详细内容。

4

2026.01.19

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

2

2026.01.19

xml格式相关教程
xml格式相关教程

本专题整合了xml格式相关教程汇总,阅读专题下面的文章了解更多详细内容。

4

2026.01.19

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

13

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

93

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

112

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SciPy 教程
SciPy 教程

共10课时 | 1.2万人学习

R 教程
R 教程

共45课时 | 5.2万人学习

SQL 教程
SQL 教程

共61课时 | 3.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号