【CV论文笔记】Learning a Similarity Me

作者: 蘑菇轰炸机 | 来源:发表于2020-03-04 23:07 被阅读0次

【CV论文笔记】Learning a Similarity Me
【CV论文笔记】Learning to Compare Imag
【CV论文笔记】Deep metric learning usi
【CVPR】Person RE-ID文献摘要【更新中。。】
2018-07-24
25组-Deep Residual Learning for I
论文阅读笔记 RPT: Learning Point Set R
Travel Time Estimate (TTE)（定期更新）
深度学习学习资料
深度学习经典论文Top100 系列之优化-Dropout(1)

本文主要用于介绍LeCun团队提出的一种相似性度量的方法。本笔记主要为方便初学者快速入门，以及自我回顾。

论文链接：http://yann.lecun.com/exdb/publis/pdf/chopra-05.pdf

基本目录如下：

摘要
核心思想
总结

------------------第一菇 - 摘要------------------

1.1 论文摘要

我们提出了一种方法用于从数据中去训练学习相似度的评价指标。这个方法可以被用于识别或者验证任务，通常是那种类别的数量很大，或者说是在训练的时候不确定的，然后每一个类别的训练样本又很小的。基本的思想原理就是去学习一个方法，该方法能够映射输入的特征到目标空间，然后在目标空间使用L1正则，用于近似评估输入空间的语义（semantic）距离。该方法能够被用于人脸验证任务。学习的过程就是去最小化度量损失函数，让相似的配对图之间的距离能够减少，而不相似的配对图的距离增大。整个从一个纬度空间映射到另一个纬度是通过卷积网络实现的，这种网络对各种图片的几何变化具有很好的鲁棒性。整套系统在Purdue/AR人脸数据库（具有丰富的姿态，光照，表情，位置等）上进行了测试，效果还是可以的～

------------------第二菇 - 核心思想------------------

2.1 核心思想

传统用于分类的判别式方法，包括神经网络，支持向量机等，都需要提前知道所有的类别分类。并且还希望所有的类别的样本是均匀分布的，且样本的类别数量最好是可控的（大概在100左右）。但是这种方法却并不适用于那种类目的数量很大，且在训练阶段只有一部分的样本是已知的情况。比如，人脸检测和人脸验证等。这种实际的应用场景，往往一个类别的数量是非常少的，且类目数量巨大。通常处理这种情景的办法都是基于“距离”度量的，另外一种就是基于生产式模型。

本文提出的一种解决办法就是从数据中去学习一种相似度的度量方法。这种相似度的度量方法后续可以用于匹配新的样本与已知样本。该方法的核心思想就是将输入样本映射到目标空间，然后在目标空间中用一种评估方法来衡量输入的“语义”距离。

接下来，我们就来仔细研读一下，整一套框架体系是如何搭建的。

2.1.1 Siamese Architecture

整体的网络架构如下图所示，

Siamese Architecture.jpg

假设 $X_1$ 和 $X_2$ 就是我们的一组输入图片， $Y$ 就是一个二分类的标签，如果这组图片相似（属于同一个人）则为1，如果不相似则为0。然后 $W$ 就是共享的参数， $G_w(X_1)$ 和 $G_w(X_2)$ 就是映射后的特征值，则我们可以定义一个标量“能量方程（energy function）”，