ICLR2022 | 基于对抗自注意力机制的预训练语言模型

2022-07-12 14:49:41 浏览数 (5)

每天给你送来NLP技术干货！

©作者 | 曾伟豪

单位 | 北京邮电大学

研究方向 | 对话摘要生成

排版 | PaperWeekly

论文名称：

Adversarial Self-Attention For Language Understanding

论文来源：

ICLR 2022

论文链接：

https://arxiv.org/pdf/2206.12608.pdf

Introduction

本文提出了 Adversarial Self-Attention 机制（ASA），利用对抗训练重构 Transformer 的注意力，使模型在被污染的模型结构中得到训练。

尝试解决的问题：

大量的证据表明，自注意力可以从 allowing bias 中获益，allowing bias 可以将一定程度的先验（如 masking，分布的平滑）加入原始的注意力结构中。这些先验知识能够让模型从较小的语料中学习有用的知识。但是这些先验知识一般是任务特定的知识，使得模型很难扩展到丰富的任务上。
adversarial training 通过给输入内容添加扰动来提升模型的鲁棒性。作者发现仅仅给 input embedding 添加扰动很难 confuse 到 attention maps. 模型的注意在扰动前后没有发生变化。

为了解决上述问题，作者提出了 ASA，具有以下的优势：

最大化 empirical training risk，在自动化构建先验知识的过程学习得到biased（or adversarial）的结构。
adversial 结构是由输入数据学到，使得 ASA 区别于传统的对抗训练或自注意力的变体。
使用梯度反转层来将 model 和 adversary 结合为整体。
ASA 天然具有可解释性。

Preliminary

表示输入的特征，在传统的对抗训练中，通常是 token 序列或者是 token 的 embedding，表示 ground truth. 对于由参数化的模型，模型的预测结果可以表示为。

2.1 Adversarial training

对抗训练的目的是旨在通过推近经过扰动的模型预测和目标分布之间的距离来提升模型的鲁棒性：

其中代表经过对抗扰动扰动后的模型预测，表示模型的目标分布。

对抗扰动通过最大化 empirical training risk 获得：

其中是对做出的约束，希望在较小的情况下给模型造成较大的扰动。上述的两个表示展示的就是对抗的过程。

2.2 General Self-Attention

定义自注意力的表达式为：

在最普通的自注意力机制中代表全等矩阵，而之前的研究中，代表的是用来平滑注意力结构的输出分布的一定程度的先验知识。

作者在本文将定义为元素为的 binary 矩阵。

Adversarial Self-Attention Mechanism

3.1 Optimization

ASA 的目的是掩盖模型中最脆弱的注意力单元。这些最脆弱的单元取决于模型的输入，因此对抗可以表示为由输入学习到的“meta-knowledge”：，ASA 注意力可以表示为：

与对抗训练类似，模型用来最小化如下的 divergence：

通过最大化 empirical risk 估计得到：

其中表示的是的决策边界，用来防止 ASA 损害模型的训练。

考虑到以 attention mask 的形式存在，因此更适合通过约束 masked units 的比例来约束。由于很难测量。

的具体数值，因此将 hard constraint 转化为具有惩罚的 unconstraint：

其中 t 用来控制对抗的程度。

3.2 Implementation

作者提出了 ASA 的简单且快速的实现。

对于第自注意力层，可以由输入的隐层状态获得。具体而言，使用线性层将隐层状态转化为以及，通过点乘获得矩阵，再通过重参数化技巧将矩阵 binary 化。

由于对抗训练通常包括 inner maximization 以及 outer minimization 两个目标，因此至少需要两次 backward 过程。因此为了加速训练，作者采用了 Gradient Reversal Layer（GRL）将两个过程合并。

3.3 Training

训练目标如下所示：

表示 task- specific 损失，表示加上 ASA 对抗后的损失，表示对于对于的约束。

Experiments

4.1 Result

从上表可以看出，在微调方面，ASA 支持的模型始终在很大程度上超过了原始的BERT 和 RoBERTa. 可以看到，ASA 在小规模数据集比如说 STS-B，DREAM 上表现优异（一般认为这些小规模数据集上更容易过拟合）同时在更大规模的数据集上如 MNLI，QNLI 以及 QQP 上仍然有较好的提升，说明了 ASA 在提升模型泛化能力的同时能提升模型的语言表示能力。

如下表所示，ASA 在提升模型鲁棒性上具有较大的作用。

4.2 分析实验

1. VS. Naive smoothing

将 ASA 与其他注意力平滑方式进行比较。

2. VS. Adversial training

将 ASA 与其他对抗训练方式进行比较

4.3 Visualization

1. Why ASA improves generalization

对抗能够减弱关键词的注意力而让非关键词接受更多的注意力。ASA 阻止了模型的懒惰预测，但敦促它从被污染的线索中学习，从而提高了泛化能力。

2. Bottom layers are more vulnerable

可以看到 masking 占比随着层数由底层到高层逐渐降低，更高的 masking 占比意味着层的脆弱性更高。

Conclusion

本文提出了 Adversarial Self-Attention mechanism（ASA）来提高预训练语言模型的泛化性和鲁棒性。大量实验表明本文提出的方法能够在预训练和微调阶段提升模型的鲁棒性。

·

NLP服务

0 人点赞

上一篇：分享雷军22年前编写的代码

最新文章

更多»

在 C# 中获取操作系统相关信息 AI 检索器(AI Retriever)：RAG的重要组成部分，超强的商业优势基于知识库、工作流的智能体实践前端性能优化玩转腾讯混元 | 腾讯混元大模型AIGC系列产品技术有奖征文活动 Docker/DockerHub 国内镜像源/加速列表（长期维护 0926更新） Safari浏览器统一字体之自定义CSS样式表蓝牙耳机丢了，我花几分钟写了一个小程序，找到了！ #HarmonyOS NEXT#写了一个好用的语音播报demo 【Docker项目实战】使用Docker部署myspeed网络测速工具

热门手册

更多»

Svn

Ruby

Python

Php

Nodejs

Mysql

Linux

Jquery

Javascript

Java

Html

Git

推荐教程

更多»

设计模式、高可用性、高弹性、运维、监控与自动化



前后端分离的思考与实践



Susy 2 入门教程



让web app更快的HTML5最佳实践



Stack Overflow 揭秘程式开发者15 个不为人知的秘密



MySQL 5.7版本新特性连载



Redis 基础教程



架构之重构的12条军规



learnyounode 简体中文版



代码之谜

网站相关

关于字节宝

用户协议

网站地图

文章存档

常用链接

教程大全

文档大全

技术文章

字节宝手机版

官方APP

字节宝

Python字节宝

Java字节宝

字节宝工具箱

联系我们

帮助中心

商务合作QQ：3111859717

下载App

关注公众号

Copyright©2023 字节宝 |

违法和不良信息举报电话：|举报邮箱：3111859717@qq.com