美文网首页
2020-10-07

2020-10-07

作者: 小小程序员一枚 | 来源:发表于2020-10-08 09:11 被阅读0次

    踩过的坑:https://blog.csdn.net/xufwind/article/details/86091231

    安装flair framework时,.py文件取名和flair包重名了,改成不一样的就好了,参考上面那篇文章

    flair库的github链接
    https://github.com/flairNLP/flair

    Flair是一个基于PyTorch构建的NLP开发包,它在解决命名实体识别(NER)、部分语音标注(PoS)、语义消歧和文本分类等NLP问题达到了当前的最高水准。它是一个建立在PyTorch之上的NLP框架。

    目前很多前沿的论文都会在flair框架的基础上加以改进,实验证明,在conll2003数据集上的效果有所提升,具体的F1值见下表:

    CoNLL2003最新进展

    论文

    Deep contextualized word representations

    这篇论文的主要贡献在于提出了ELMo(Embeddings from language models)模型,它是一种深层双向上下文词嵌入模型,实现的框架还是BiLSTM,不同之处在于它将每一层LSTM的输出都拼接起来,作为最终词嵌入向量的表示,在应用到下游任务时,只需要微调模型,就能让下游任务(比如:NER,Q&A等)的性能提高很多

    Contextual String Embeddings for Sequence Labeling

    这篇文章的主要工作在于基于先前字符预测下一字符,作者指出模型有两个不同之处:1)该模型在没有任何单词概念下被训练,本质上将单词建模为字符序列 2)通过其周围文本进行语境化,因此同样的单词在不同的上下文语境中具有不同的嵌入

    相关文章

      网友评论

          本文标题:2020-10-07

          本文链接:https://www.haomeiwen.com/subject/fwxauktx.html