美文网首页深度学习
2020自然语言处理 ElMo 模型

2020自然语言处理 ElMo 模型

作者: zidea | 来源:发表于2020-03-17 20:12 被阅读0次
    elmo

    问题

    • Have you paid that money to the bank yet? (银行)
    • It is safest to deposit your money in the bank. (银行)
    • They stood on the river bank to fish (岸边)

    每一个句子都出现 bankbank 他们是不同 token 但是同一 type。过去只要 type 一样的,他们 word embedding 就是一样。希望机器给不同意思 token 给出不用 word Embedding. 如何认为参与添加 type 这样做起来???。

    目标

    • 希望每一个词汇 token 都有一个 word Embedding 与之对应
    • 词汇 token 由其所处上下文来决定

    ELMo(Embeddings from Language Model)

    ELMo 是基于 RNN 的语言模型


    elmo.jpeg

    这个 RNN 模型就是预测下一个词,学习完之后我们就具有上下文的词嵌入。现在同一个词如果上下文不同输出词向量就不同。随意是相同 token 但是因为之前词汇不同。

    ELMo 通常可以叠很多层神经网络,每一层都有输出,在 ELMo 模型会把每一个层输出都组合起来进行输出。
    这里\alpha_1\alpha_2 参数取值是和接下来使用词向量要做的任务相关,不同任务 \alpha_1\alpha_2 取值也会不同,所以 \alpha_1\alpha_2 作为接下来模型参数一部分被学出来。

    • token 表示没有上下文情况获取词向量
    • LSTM 1 和 LSTM 2 就是 ELMo 的隐藏层,词汇通过每一层都会得到一个词嵌入向量。
    • 然后我们通过对每一层输出词嵌入向量做加权得到最终的输出

    横坐标为要做的语言任务,而纵坐标表示对每一个层权重的大小

    任务分类

    • SRL (语义角色标志)
    • Coref (消歧)主要做的就是将代名词所指代的名称找出来
    • SNLI (自然语言推理)
    • SQuAD (阅读理解,问答系统)
    • SST-S (情感分析)

    相关文章

      网友评论

        本文标题:2020自然语言处理 ElMo 模型

        本文链接:https://www.haomeiwen.com/subject/anjcdhtx.html