无需聚类，杭电学者提出基于软化相似度学习的无监督行人再识别

作者: 我爱计算机视觉 | 来源:发表于2020-12-28 16:05 被阅读0次

无需聚类，杭电学者提出基于软化相似度学习的无监督行人再识别
聚类算法
聚类算法
KMeans聚类算法实现鸢尾花的聚类
2019-03-05
聚类分析
K-Means聚类算法
K-Means算法介绍
聚类算法k-means
K-Means

作者 | Ass

编辑 | CV君

报道 | 我爱计算机视觉（微信id：aicvml）

Unsupervised Person Re-identification via Softened Similarity Learning：

基于软化相似度学习的无监督行人再识别

论文链接：https://arxiv.org/abs/2004.03547
代码链接：https://github.com/ryanaleksander/softened-similarity-learning（非官方）
第一作者：Yutian Lin（现在在武汉大学任副研究员）
合作作者单位：杭州电子科技大学（第一作者），华为技术有限公司，百度研究院，悉尼科技大学 ReLER 实验室

01 看点

图像数据采用完全无标签化；

放弃聚类方法，采用软标签来解决硬量化损失（hard quantization）；

图像切片信息和跨摄像机标识信息在无监督领域中的应用；

在采用无监督方法的行人重识别领域中实现了SOTA。

其主要亮点如下：

1.放弃聚类方法，采用软化分类（softened classification）

聚类的缺点：基于聚类的方法将图像粗略地划分为聚类进行训练，使得模型高度依赖于聚类结果。如图1 (b)所示，同一个人的图像可以被分成不同的聚类，这些聚类使用错误分配的伪标签被进一步训练。由于无监督聚类的错误是不可避免的，具有硬量化损失的学习可能倾向于拟合由聚类产生的噪声标签。

软化标签分类：与聚类方法中图像属于一个精确类别的原始 one-hot 标签不同，文中是挖掘未标记图像之间的关系作为温和的约束。作者会对与 target 相似度较高的前 k 个图像都分配软标签，将标签视为一个分布，鼓励图像与几个相关类别相关联。下图中紫色的为 target，黄色为与 target 相近的 k 个可依赖图像。

2. 引入了一些辅助信息来帮助找到相似的图像

软标签的约束相对较弱，但是相比较于硬分类，这也给算法提供了更多的空间。所以当测量图像之间的相似性时，每个行人图像的全局和部分特征和摄像机标识信息也会被考虑在内。

02提出的方法

框架可以分为三个子组件(显示在三个彩色矩形中)：

采用基线分类网络将每个图像分类为不同的类别并生成特征表示；

基于特征嵌入和辅助信息探索未标记图像之间的相似性，为每个训练数据选择k个可靠（reliable）图像；

根据生成的k个可靠图像对目标标签分布进行软化，用软化后的标签对网络进行微调，使得选中的k个可靠图像更近，排斥其他图像。

下面我将介绍每个组件的具体实现步骤。

一、Baseline：Initialization with Hard Labels

总体模型框架图中红色框和红色箭头属于此baseline步骤

目的：

步骤：

2. 无参数分类器：

非参数分类器的分类模型：我的理解是直接用标准化后的图像特征来进行分类，无需经过其它层，则称为非参数分类器。

②分类：一个图像x属于i-th类的可能性通过softmax定义

③ 损失和优化器

损失：交叉熵损失

其中t(yj)是类别标签上的条件经验分布。对于ground-truth类，我们将分布的概率设置为1，对于所有其他类，设置为0。

二、Model Learning with Softened Similarity

总体模型框架图中绿色和蓝色属于此步骤

目的：

不仅最小化每个图像特征与查找表中的ground-truth特征之间的余弦距离，而且最小化每个图像的特征与其可靠图像之间的距离。同时，每个图像特征和其他类别的特征之间的余弦距离被最大化。

强迫同一个人的特征属于不同的类，会对网络产生负面影响。因此作者提出了为被估计为相同行人的图像分配一个类似的表示的方法，也就是软标签方法。

步骤：

其中λ是一个超参数，它平衡ground-truth类和reliable类之间的关系。当λ为1时，基线网络中简化为只有0和1标签的函数，即模型学习识别出每幅图像的ground-truth标签，但无法学习同一个人的图像之间的相似性和一致性。另一方面，当λ太小时，模型可能无法预测ground-truth标签。

4.损失：交叉熵损失