1、将词转为特定数字,paddle里有50万个词的对应索引值,意思相近的词在数值上也比较相近
2、将第一步中的一维数组通过embeding处理为二维矩阵,根据第一步的索引值查询对应词的向量,根据词向量组成矩阵
3、sequence_pool('sum')得到left_pool & right_pool
4、Softsign 即softmax处理left_pool & right_pool
5、全连接层FCLayer
6、计算第4步得到的句子a和b的cos相似值
关键点在:
50万个词的索引值
缺点:
专业名词不在50万个词的范围内的话,效果不好
网友评论