- 随笔:
1.通过对NCBI-disease数据集标错的分析,我有一种感觉,很多时候对疾病前面的修饰词是否与疾病一起标注为实体没有一个较为明确的标准,比如:”congenital DM“先天性心脏病前面的修饰词先天性到底是否需要标,很多时候是否正确,仅仅只是符合标注人员的习惯,是否需要做个统计,然后人工设计几条规则,比如收集训练集中哪些修饰词标注的比较多,对最后识别出来的结果进行修正
2.下一步针对前面的多任务学习的话,可能得找一个相关性较强的任务去共同训练,但具体是什么,还没有太明确的想法,比如:文本分类任务
网友评论