题目:Named Entity Recognition and Relation Extraction
using Enhanced Table Filling by Contextualized Representations
摘要:本文提出了一种新的基于table表示的非结构化文本命名实体和关系抽取方法,通过使用上下文的词嵌入,该方法无需复杂的手工特征或神经网络体系结构就可以计算实体提及和长距离依赖的表示,我们还调整了一个张量点乘积来同时预测关系标签,而不求助于基于历史的预测或搜索策略。实验结果表明,该方法在conll04和ACE05数据集上的性能优于现有的方法。我们还证实,当为上下文聚合提供多个句子时,所提出的方法与ACE05数据集上的最先进的ne模型具有相当的性能
模型:
- 命名实体识别:
我们用BILOU(开始、内部、最后、外部、单位长度)表示法来表示NE的间距。我们认为NER是一个序列标注任务,其中输入中的每个单词wi在BILOU表示法中都被标记为yi。在本研究中,我们在以前的时间步骤中使用span特征来增强现有的体系结构。
特别的,模型预测词wi的NE标签基于以下3个特征:1)wi的嵌入表示e(wi) 2)在前一时间步的标签y(i-1)的嵌入l(y(i-1)) 3)前面一个NE的bert嵌入的最大池化
实验: - 数据集:CoNLL04、ACE05、CoNLL03
CoNLL04:4种实体类型和5种关系类型
ACE05:包括7种粗粒度实体类型和6种粗粒度关系类型
CoNLL03:包含4种不同的实体类型,我们使用这个数据集来度量在文档中使用跨句上下文的NER的性能 -
实验结果:
-
消融实验:
-
多句NER:
网友评论