美文网首页
Deep Metric Learning for Practic

Deep Metric Learning for Practic

作者: LKONE | 来源:发表于2021-09-23 18:01 被阅读0次

Deep Metric Learning for Practical Person Re-Identifification(PDF)


Author:Dong Yi, Zhen Lei, Stan Z. Li  ICPR2014 (Citations:961)

核心思想:


问题引入:

本文针对人重识别任务提出,人重识别任务需要判断两幅人像是否属于同一对象。但是这些人像大部分由广角监控摄像头所捕捉,在很大程度上会受到摄像机视角变化、姿势变化、不稳定的光线及低分辨率等因素的影响,导致这类图像有两个显著的特性:一是类内变化大,二是类间会产生歧义。因此,人重识别的关键在于学习到良好的表征和度量来评估样本之间的相似性。此外,由于训练数据集和测试数据集之间不会有重叠区域,因此一个现实的人重识别算法应该具有良好的泛化性能。

解决方案:

孪生卷积神经网络:

       目前,大部分的人重识别算法方法主要包含两个步骤即特征提取和度量学习。本文的灵感来源于孪生网络,主要提出了孪生卷积神经网络,该网络由两个卷积神经网络,一个连接函数和一个损失函数组成。

图1 孪生卷积神经网络结构

1.卷积神经网络:由于在人重识别任务重中,训练集中的目标与测试集中的目标是完全不同的,因此在这种情况下传统的“样本→标签”的神经网络不能够适用。

本文参照孪生网络结构,构建了孪生神经网络,通过两个子网络来实现“样本对→标签”模式。至于两个子网络间参数是否共享,将有具体任务所决定。参数不共享,网络能够更自然地处理特定视角的匹配任务;参数共享,则网络更适用于通用任务,如跨数据集人重识别。

2.连接函数:连接函数用来评估两个样本之间的关系(相似度),常见的连接函数有距离函数、相似性函数或其它函数,如欧氏距离、马氏距离、余弦相似度、绝对误差(距离)和向量链接等。

图2 连接函数:欧式距离,余弦相似度,绝对距离,向量链接

其中,欧式距离的导数形式简单,但是其输出是无界的,这可能会使训练过程不稳定。绝对距离在某些情况下是不可导的。而余弦相似度有界,具有尺度不变形。

3.损失函数:本文选择了二项式偏差作为损失函数,其表达式如下:

图3 二项式偏差损失函数

其中,S_{ij} 是两个样本x_{i} x_{j} 之间的相似性度量,M_{ij} 用来判断两个样本是否来自相同的目标对象。n_{1} 是正样本对的数量,n_{2} 是负样本对的数量。

       综上所述,本文的主要模型由参数共享的卷积神经网络,基于余弦相似度的连接函数和基于二项式偏差的损失函数三部分组成。

相关文章

网友评论

      本文标题:Deep Metric Learning for Practic

      本文链接:https://www.haomeiwen.com/subject/vseogltx.html