LEBERT：Lexicon Enhanced Chinese

LEBERT：Lexicon Enhanced Chinese

作者: Tsukinousag | 来源:发表于2022-02-13 14:15 被阅读0次

LEBERT：Lexicon Enhanced Chinese
论文阅读_用字典提升基于BERT的中文标注效果
基于BERT Adapter的词汇增强型中文序列标注模型
Technology-Enhanced Teaching and
NLTK VADER lexicon Structure for
Para. 1-2
Grammar Lexicon
be greatly enhanced
A Brief Introduction of Kyuubi A
vader-sentiment 代码解析

提出了一种用于中文序列标注的词库增强型BERT，通过Lexicon Adapter layer 将外部词库知识融入到BERT层中

汉语序列标注中在不同层次中融合词汇特征和BERT的比较。为了简单起见，在BERT中只显示了两个转换层，并将句子截断为三个字符。ci表示第i个中文character，wj表示第j个中文word

将词汇整合到了底层，在BERT的transformer层之间集成lexicon信息，通过将一个汉语句子与一个现有词汇进行匹配，将其转换为一个字符-单词对序列。词典适配器用于动态提取最相关的匹配项，每个字符的单词使用字符到单词的双线性注意机制，词典适配器应用于BERT中相邻transformer之间，词典特征和BERT表示通过BERT中的多层编码器充分交互

证实了底层特征集成有助于跨度边界检测和跨度类型确定。

BERT Adapter旨在学习下游任务的任务特定参数。在预先训练好的模型层之间添加适配器，只为特定任务来调整添加的适配器中的参数。

We apply the Lexicon Adapter between the 1-st and 2-nd Transformer in BERT and fine-tune both BERT and pre-trained word embedding during training.

两个主要区别：

LEBERT同时具有character特征和lexicon特征作为给定的输入，汉语句子被转换为一个character-words对序列
transformer之间连接有一个lexicon adapter，将lexicon knowledge整合到Bert中

1. Char-Words Pair Sequence

we first build a Trie based on the D(a Chinese Lexicon D),

2. Lexicon Adapter

对于第i个位置的 char-words 对序列,输入表示为

h(i,c)表示的是character向量，由当前transformer输出，x(i,ws)表示的是word embedding

对于第j个word，从预训练word word embedding 查找表计算

为了对齐两种不同的表示，将查找到的x(ij,w)，进行下面的维度计算

为了从所有匹配的单词中找出最相关的单词，引入了character-to-word的注意机制

对于第i个character，其word组合为Vi，和h(i,c),W矩阵计算全局ai，再对于第j个word， a(i,j)*v(ij,w)，求和计算后的到z(i,w)

最后得到lexicon的权重信息

3. Lexicon Enhanced BERT

如何 inject lexcion信息在第k层和第(k+1)层 Transformer

适配器输入一个character向量和成对的word feature。通过对字符和单词的双线性attention，将lexcion特征加权为一个向量，然后将该向量添加到character向量，然后进行layer normalization.

4. training

相关文章

LEBERT：Lexicon Enhanced Chinese
提出了一种用于中文序列标注的词库增强型BERT，通过Lexicon Adapter layer 将外部词库知识融入...
论文阅读_用字典提升基于BERT的中文标注效果
论文题目：Lexicon Enhanced Chinese Sequence Labeling Using BER...
基于BERT Adapter的词汇增强型中文序列标注模型
©原创作者|疯狂的Max 论文Lexicon Enhanced Chinese Sequence Labellin...
Technology-Enhanced Teaching and
下载地址：Technology-Enhanced Teaching and Learning of Chinese...
NLTK VADER lexicon Structure for
VADER lexicon基本结构 vader_lexicon.txt文件是以tab键分割的四列字段组成的第一列：...
Para. 1-2
Signs of the times The lexicon of 2018 is depressing. But...
Grammar Lexicon
翻译：原文ANTLR的词典对大部分程序员来说都是很熟悉的，它根据C语言的语法以及派生出来的一些语法描述扩展。注释...
be greatly enhanced
Your ability to function in the world can be greatly enha...
A Brief Introduction of Kyuubi A
Kyuubi Architecture Kyuubi is an enhanced edition of the ...
vader-sentiment 代码解析
字典加载对字典的说明见此篇博客NLTK VADER lexicon Structure for sentimen...

网友评论

本文标题：LEBERT：Lexicon Enhanced Chinese

本文链接：https://www.haomeiwen.com/subject/itsflrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|LEBERT：Lexicon Enhanced Chinese |投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！