一、实体识别的难点,不好建模
比如投资关系。
1.方向:投资方和被投方
2.复杂,关系多维:投资方有多个,被投资只有一个。一对多,多对一,多对多
3.俩个实体有多个关系:某两个人 既是同学,又是夫妻
4.标注问题
二、先实体识别、再抽取关系
预测出头之后,再根据之前的命名实体识别,把后面的进行补充。
(获取用一个实体的尾巴去预测另一个实体的尾巴)
B-loc 开始
I-loc 中间的和结束
o other
BIO 或者BIOES
['N']代表没有关系
比如:LI Taylor Swift
LI B-loc ['N']
Taylor I-loc ['N']
Swift I-loc ['出生于','工作于'] [7,8]
用一个实体的尾巴去预测另一个实体的尾巴
而不需要把LI
LI B-loc ['出生于','工作于'] [7,8]
Taylor I-loc ['出生于','工作于'] [7,8]
Swift I-loc ['出生于','工作于'] [7,8]
这样就是多对多,把情况变复杂了
网友评论