[读paper]MSMT17数据集和PTGAN

作者: 北小卡 | 来源:发表于2018-07-19 22:57 被阅读0次

[读paper]MSMT17数据集和PTGAN
2018-12-07
TensorFlow（二）制做自己的数据集
数据驱动和图形语法的数据可视化
Apache Spark如何做空间数据管理？
sklearn数据集的获取与划分
学术界对话系统总结
高数没用？看看机器学习的公式，验证下微积分都还给老师没
Apache Beam入门学习一
数据分析R语言实战学习笔记（一）

1. 相关链接

Paper 链接：Person Transfer GAN to Bridge Domain Gap for Person Re-Identification
Dataset 链接： MSMT17
Code 链接：PTGAN

2. 总览

提出了一个新的数据集MSMT17：多摄像头，多人，多 bouding boxes；光线差别大，角度差别大。
总之就是更加贴近实际场景。

MSMT17
提出PTGAN，借鉴CycleGAN的思想来降低同个方法在不同数据集表现的差异，以此降低标注新数据集的工作量。

PTGAN展示1
PTGAN展示2

3.Detail

3.1 MSMT17数据集

15 个摄像头：12个室外，3个室内
采集4天，每天的天气不一样：大概是为了光线差异大一些
选取每天早上，中午，下午的各3小时作为粗略的视频标注参考对象：即一天只考虑选9小时，弃了晚上--->太黑贡献不大？
在经过进一步选择后，最终版的视频只选了每个摄像头每天3个小时的视频，总共为 3*4天×15个摄像头= 180个小时
所以视频时间从 9个小时 × 15个摄像头 × 4天 = 540个小时 ----->> 3个小时 × 4天 × 15个摄像头 = 180个小时

MSMT17统计

1. bounding_box_train: list_train + list_val
1041 identities, 32620 bounding box
2. bounding_box_query: list_query
3060 identities, 11659 bounding box
3. bouning_box_gallery: list_gallery
3060 identities, 82161 bounding box
4. bounding_box_val:
1041 identities, 2373 bounding box

3.2 Person Transfer GAN(PTGAN)

(注:以下为自己的另类解读思路)
1. 一般而言， 为了不单单从数字多少上说明自己数据集比别的数据集要更好，更有价值，同时也进一步说明自己提出数据集的高效性或者广袤的覆盖性，而不是虽然数字多，但是别人用数字少的图片也能达到这种效果，我们自然的想法就是：
- 用在我们数据集上的方法训练，拿到另一个数据集上测试的办法比你反过来搞要好，说明我们**覆盖性**好，发这么多图片是有必要的 （ 由于数据集差异，正常情况下，一般不可能orz， 所以。 。）
- 虽然我们数据集大，但是每张图片包含的信息多啊，我一张等于你好多张， 训练几张我就能达到跟你一样的效果，说明我们数据集**高效**，这么多的光强变化是必要的 （由于数据集差异，正常情况下，一般也不可能orz， 所以。。 ）
2. 所以，重点是解决**数据集的差异性问题**，假若数据集没有差异，而且经验证新的**数据集**最终**覆盖性和高效性更好**，那么数据集发布成立！
而数据集的差异解决办法，从前人借鉴，进行**数据集之间的风格转换！！**

3.为了解决这个数据集的差异问题，作者以CycleGAN的想法入手，对于一幅图片要变换成另一种数据集的风格，那么约束为：
$\mathcal{L}_{PTGAN} = \mathcal{L}_{Style} + \lambda_1\mathcal{L}_{ID}$
其中 $\mathcal{L}_{Style}$ 主要控制生成图片的风格， $\mathcal{L}_{ID}$ 主要控制生成图片的人物，不要被新的背景干扰，从而失真。而：
$\mathcal{L}_{Style} = \mathcal{L}_{GAN}(G, D_B, A, B) + \mathcal{L}_{GAN}(\overline{G}, D_A, B, A) + \lambda_2\mathcal{L}_{cyc}(G, \overline{G})$
$\mathcal{L}_{GAN}$ 为一般的鉴别器和生成器损失函数， $\mathcal{L}_{cyc}$ 循环一致损失，这个都是cycleGAN的相关损失函数。
创新点在于：
$\mathcal{L}_{ID} = \mathbb{E} _{a \sim p_{data}}[||(G(a) - a)\odot M(a)||_2] + \mathbb{E} _{b \sim p_{data}}[||(\overline G(b) - b)\odot M(b)||_2]$
其中， $M(a)$ 与 $M(b)$ 皆为对图片的语义分割，即图片的前景（图片的人）要保持一致，不要被风格影响了人物形态，衣着等等。

风格迁移的结果

4. 想法已经成立了，就是把数据集之间进行风格迁移，然后最终再从覆盖性和高效性来说明自己发布的**数据集优势**。
但是为了达到这个目的，首先得先说明，这种风格迁移是能解决数据集差异的，别的数据集迁移过来后，在本数据集上测试效果要好。

3.3 Experiments

所以实验的思路就是：

说明 PTGAN 的风格迁移能解决数据集差异
解决了差异后，用同个方法在自己发布的数据集上训练，之后去测试自己的覆盖性和高效性

PTGAN 解决数据集差异
其中红色和绿色代表 Rank-1的结果，蓝色和黑色代表Rank-10的结果。
重点关注下图的绿色和黑色。
在别人数据集进行迁移的实验对比

结论：
迁移后的数据集确实表现比原数据集好，说明迁移能降低数据集之间的差异性！！

正式进行自己数据集与他人数据集的对比

Duke数据集：训练集有16,522张图（1w多张）
Market数据集：训练集有12,936张图
CUHK03数据集：训练集26,264张图
MSMT17数据集：训练集有32,621张图（10%为3262张图， 3k多张）

效果对比

从 Table 4 知道，Duke数据集迁移到MSMT17后，测试效果最好。
但是从Table 5 的 MSMT(10%)可以发现，用10%的MSMT17数据集训练后，竟然与Duke数据集全部迁移过来再训练的效果类似。
作者因此从这个角度说明，MSMT17的数据集1张图片相当于Duke数据集的5张迁移的图片。MSMT17数据集更加高效。

4.Summary

提出的这个数据集非常具有挑战性，从Table 4可以知道
PTGAN的办法虽然作者主要阐述是该方法能降低之后新数据集的人工标注工作量，但实际也是为自己数据集的发布进行进一步的对比实验而服务。这个办法应该是发布新数据集的工作者要考虑的：发数据集，就要有数据集的对比。
最后说明自己数据集比较高效的对比实验好像有点勉强，更好对比的办法应该是MSMT17迁移到别人的数据集上，再与别人的数据集的测试结果进行对比。如果实际真的好，那才能说明自己数据集的覆盖性与高效性
无论如何，这篇论文的主要工作是MSMT17数据集的发布，值得后来人进行follow。

5. 疑惑

发布的数据集的命名没有仔细的解释，自己暂时猜测命名如下：
id _ 第几张图 _ 摄像头id _ 日期（早上中午或者下午）_ 视频中的第几帧 _ number _ 偶尔出现的ex.jpg
其中number 和偶尔出现的ex暂时还不知道意思
论文最后与Duke数据集对比，说明自己数据集高效性那里，是不是写错了自己10%训练集的图片数量？2602？如果错的话，那么后面的1:6.3是不是也错了呢?
如果图片命名的方式没错的话，那就是1月到3月的数据集，可论文说是一个月内的某个四天？

[读paper]MSMT17数据集和PTGAN
1. 相关链接 Paper 链接：Person Transfer GAN to Bridge Domain Gap...
2018-12-07
1. paper《Predicating the Next Location:》数据集 ① Gowalla ht...
TensorFlow（二）制做自己的数据集
1.数据集格式 2. 数据集制作代码参考资料 [1] TensorFlow 制作自己的TFRecord数据集读...
数据驱动和图形语法的数据可视化
数据驱动和图形语法的数据可视化http://xueshu.baidu.com/usercenter/paper/s...
Apache Spark如何做空间数据管理？
周日的深夜，适合静心读paper。。。在大数据，时空这两个维度其实缺一不可。空间数据管理【Geospatial ...
sklearn数据集的获取与划分
划分数据集获取sklearn本地的数据集描述iris数据集从网络获取数据集网络获取划分训练集和测试集数...
学术界对话系统总结
本文包括对话系统分类、数据汇总、和一些目前对话系统paper的总结、评价。以下paper的“一句话评论”均为个人...
高数没用？看看机器学习的公式，验证下微积分都还给老师没
KNN分类 K-近邻算法，把数据集分为训练数据集和测试数据集，用训练数据集导入KNN，对于一个数据向量，计算此数据...
Apache Beam入门学习一
一、Beam编程基本概念 PCollection：数据集，可能是有界数据集（数据量有限）和无界数据集（数据量无限）...
数据分析R语言实战学习笔记（一）
第二章数据的读取和保存查看和载入数据集 data() 查看数据集列表data(CO2) 载入CO2数据集l...

[读paper]MSMT17数据集和PTGAN

1. 相关链接

2. 总览

3.Detail

3.1 MSMT17数据集

3.2 Person Transfer GAN(PTGAN)

3.3 Experiments

4.Summary

5. 疑惑

相关文章

[读paper]MSMT17数据集和PTGAN

2018-12-07

TensorFlow（二）制做自己的数据集

数据驱动和图形语法的数据可视化

Apache Spark如何做空间数据管理？

sklearn数据集的获取与划分

学术界对话系统总结

高数没用？看看机器学习的公式，验证下微积分都还给老师没

Apache Beam入门学习一

数据分析R语言实战学习笔记（一）

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读