美文网首页NLP
paddlepaddle句子相似度之bow

paddlepaddle句子相似度之bow

作者: 天空之翼 | 来源:发表于2019-11-06 10:04 被阅读0次

1、将词转为特定数字,paddle里有50万个词的对应索引值,意思相近的词在数值上也比较相近
2、将第一步中的一维数组通过embeding处理为二维矩阵,根据第一步的索引值查询对应词的向量,根据词向量组成矩阵
3、sequence_pool('sum')得到left_pool & right_pool
4、Softsign 即softmax处理left_pool & right_pool
5、全连接层FCLayer
6、计算第4步得到的句子a和b的cos相似值

关键点在:
50万个词的索引值

缺点:
专业名词不在50万个词的范围内的话,效果不好

相关文章

网友评论

    本文标题:paddlepaddle句子相似度之bow

    本文链接:https://www.haomeiwen.com/subject/jinybctx.html