模型的训练,就是给定cost function后,用梯度下降法寻找最优值的过程。
训练Siamese网络,需要引入新的cost function。我们先看模型的学习目标,再一步一步讲解cost function的最终表达式。
解决新的问题的新的模型,关键是确定新的损失函数。
孪生神经网络的用途是什么?
简单来说,衡量两个输入的相似程度。
孪生神经网络和伪孪生神经网络分别适用于什么场景呢?
先上结论:孪生神经网络用于处理两个输入"比较类似"的情况。伪孪生神经网络适用于处理两个输入"有一定差别"的情况。比如,我们要计算两个句子或者词汇的语义相似度,使用siamese network比较适合;如果验证标题与正文的描述是否一致(标题和正文长度差别很大),或者文字是否描述了一幅图片(一个是图片,一个是文字),就应该使用pseudo-siamese network
网友评论