美文网首页NLP
paddlepaddle句子相似度之bow

paddlepaddle句子相似度之bow

作者: 天空之翼 | 来源:发表于2019-11-06 10:04 被阅读0次

    1、将词转为特定数字,paddle里有50万个词的对应索引值,意思相近的词在数值上也比较相近
    2、将第一步中的一维数组通过embeding处理为二维矩阵,根据第一步的索引值查询对应词的向量,根据词向量组成矩阵
    3、sequence_pool('sum')得到left_pool & right_pool
    4、Softsign 即softmax处理left_pool & right_pool
    5、全连接层FCLayer
    6、计算第4步得到的句子a和b的cos相似值

    关键点在:
    50万个词的索引值

    缺点:
    专业名词不在50万个词的范围内的话,效果不好

    相关文章

      网友评论

        本文标题:paddlepaddle句子相似度之bow

        本文链接:https://www.haomeiwen.com/subject/jinybctx.html