Discontinuous Named Entity Recognition as Maximal Clique Discovery
Quick Look
Authors & Affiliation:
[Yucheng Wang∗, Bowen Yu∗, Hongsong ZhuTingwen Liu†, Nan Yu, Limin Sun]
[Institute of Information Engineering, Chinese Academy of SciencesSchool of Cyber Security, University of Chinese Academy of Sciences]
Link : [https://arxiv.org/pdf/2106.00218.pdf]
Comments: [e.g. Published at ACL2021]
Research Topic
- Category (General) : Information Extraction
- Category (Specific) : Disconstinuous NER
Paper summary (What)
本文提出了一种解决不连续实体识别的办法,作者将单个分块的识别和多个分块的关系抽取表示为矩阵中的标签,然后通过解码矩阵并寻找最大团的方式还原出原始的不连续实体。
Issues addressed by the paper (Why)
以往的不连续实体识别模型可以分为基于联合的方式和基于转移的方式,无论哪种方式,在训练阶段都依赖于黄金标注的中间结果,而在预测阶段使用第一阶段预测的结果进行预测,这样会造成暴露偏差。
本文的方法将不连续实体转化为两个矩阵进行等价地表示,并且可以使用最大团的方式恢复出原始的标注结果,而对最大团的解码是非参数过程,因此,本文的方法可以很好地解决暴露偏差问题。
[What are the issues that the paper addresses? Describe the problem. Why did they write this paper?]
Detailed Information (How)
20210726_3.pngMethodology
分块抽取
针对每个句子,建立一个的矩阵,其中是一个句子的token数量,以X-Y的体系建立矩阵的标签,其中,,代表实体的开头、中间和单独的实体。例如,upper body是一个POB类型的实体,那么(upper, body)对应位置上的标签为(POB-S),而(Server joint pain)是一个不连续的DE实体,那么(Server,joint)位置上是ADE-B,而(pain, pain)则是一个ADE-I类型的实体,分别表示一个不连续实体的开始和中间位置。
边的抽取
边的抽取同样是建立一个矩阵,对于连续实体,在第一个矩阵中使用S标签即可抽取出来,对于不连续实体,则建立同一个连续实体之间不同分块之间的联系。例如,(server joint, pain)是一个实体,那么分别设置(server, pain)和(joint, pain)之间的标签为ADE-H2H和ADE-T2T
20210726_2.png
Conclusion
作者提出了一种将不连续实体识别转为矩阵标签预测的模型,并且使用了最大团算法对矩阵进行解码,在多个不连续实体的识别上取得了最优的效果。
网友评论