XLNet

XLNet

作者: 南朝容止 | 来源:发表于2020-08-25 17:56 被阅读0次

XLNet预训练模型，看这篇就够了！(代码实现)
XLNet
XLNet
XLNet
XLNet 详解
XLNet: Generalized Autoregressiv
什么是 XLNet，为何它会超越 BERT？
15 分钟搭建一个基于XLNET的文本分类模型——keras实战
2021-07-15-对话模型整理
教你怎样用Transformer-XL及其进化XLNet

原理
XLNet原理挺简单的
概括起来一句就是：采取了Attention掩码的机制，来实现通过上下问来预测某个词。
详细理解
输入是和之前完全一样，该怎么输入就怎么输入，不像BERT把一些词给MASK掉了，用于上下文的词来预测这个【MASK】词；然而，XLNet是在Transformer内部，通过Attention掩码，来对某些上下文MASK掉，比如从X的输入单词里面，要预测Ti，那么就在Ti的上文和下文单词中，随机选择i-1个，放到Ti的上文位置中，把其它单词的输入通过Attention掩码隐藏掉，仅通过随机选择的这个i-1个来预测，于是就能够达成我们期望的目标。
双流自注意力
原理虽然简单，但是如何实现的呢？
主要是通过 双流自注意力 来实现

何为 双流自注意力 ？
就像下面图一样，一个是Content stream。一个是Query stream。

都是干啥的呢？
直白的讲，主要是Query stream是前线打仗的，Content stream后面生产弹药的。
举例来说，比如一个token x3将服务两种角色。当它被用作内容来 预测其他标记时 ，我们
可以使用内容表示(通过Content stream注意力来学习)来表示x3。重划重点就是 Query stream
每一轮都计算着，就是为了在为其他token预测时，能够及时的提供内容向量。
但是如果我们想要预测x3，我们应该只知道它的位置而不是它的内容。这就需要使用查询表示 (通过Query stream来学习)来保留x3之前的上下文信息，而对于要预测token x3, 只保留位置信
息。

image.png

相关文章

XLNet预训练模型，看这篇就够了！(代码实现)
1. 什么是XLNet XLNet 是一个类似 BERT 的模型，而不是完全不同的模型。总之，XLNet是一种通用...
XLNet
1、XLNet的出发点自回归语言模型AR：仅根据上文预测，或仅根据下文预测。ELMO、GPT。优势是擅长生成式自...
XLNet
原理XLNet原理挺简单的概括起来一句就是：采取了Attention掩码的机制，来实现通过上下问来预测某个词。详细...
XLNet
0. XLNet简介 2018年Bert横空出世，刷新了很多NLP任务的SOTA。之后人们开始研究对Bert的改进...
XLNet 详解
BERT 训练时将部分单词 mask 起来，使模型能够利用句子双向的信息，在很多 NLU 任务上取得很好的效果。但...
XLNet: Generalized Autoregressiv
1. 创新点 XLNet主要解决了Bert存在的一些问题，所以在介绍XLNet前，先简单介绍一下Bert，及其问题...
什么是 XLNet，为何它会超越 BERT？
原文：https://towardsdatascience.com/what-is-xlnet-and-why-i...
15 分钟搭建一个基于XLNET的文本分类模型——keras实战
今天笔者将简要介绍一下后bert 时代中一个又一比较重要的预训练的语言模型——XLNET ，下图是XLNET在中文...
2021-07-15-对话模型整理
2021AAAI_DialogXL: All-in-One XLNet for Multi-Party Conve...
教你怎样用Transformer-XL及其进化XLNet
作者 | 周俊贤整理 | NewBeeNLP 最近又重新读了Transformer-XL和XLNet的论文和代码...

网友评论

本文标题：XLNet

本文链接：https://www.haomeiwen.com/subject/nvvzjktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|XLNet|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！