视频链接:https://tianchi.aliyun.com/course/video?spm=5176.12586971.1001.25.41ac2881DxCw7l&liveId=36945
shuzhilian ai:
总共有十种瑕疵类别,首先要分析每一种瑕疵类别的样本数目各是多少,由此得出样本分布是不均衡的:
所以首先要用图像处理的方法做数据增强,把每一类样本增加到 5000 份左右。
接着还要统计缺陷的尺寸分布情况:
尺寸变化非常大。针对这一问题采用的结构是 Faster RCNN + FPN + Cascade RCNN。
因此整体的方法是:
先做数据增强,然后再采用上述的架构,backbone: ResneXt152。
针对不同尺寸的缺陷所做的改进:
Cascade RCNN 结构:
小结:
评委提问:
- 问题 1. 你改进了三个部分,我想知道哪个部分的改进对你整个算法的性能的提高最有效?
- 问题 2. 你用了 Cascade RNN 结构,这个东西如何保证收敛?它可能会越变越差。
- 问题 3. 这个题目在出的时候没有给你们负样本,你们负样本自己取的方式再简介一下,然后取完这个负样本后对你们性能的提升是一个什么程度?
- 问题 4. 在没有其他新增样本的条件下,你们在做数据增强的时候,你认为到多少量,或者说数据增强多少倍的时候,大概会到一个比较稳定的、可能没法再提升的程度?
风不动:
将各种缺陷的图像展示了出来:
并分析了所给数据的特点:
FPN 结构可以适应更多的大小尺度。
针对不规则和微小目标的检测方案:(Detection for Irregular and Tiny Objects, DIT)
DCN: Deformable Convolutional Networks
什么是 ROIPooling?什么是 ROIAlign?为什么后者比前者的效果好?
什么是 anchor?
什么是 hard example mining?什么是 OHEM?什么是 batch 级别的 OHEM?
测试阶段:什么是 NMS?什么是 Soft-NMS?什么是投票平均?
总结:
评委提问:
-
我看你们三个是北邮的学生,那你们参加这个比赛的目的是什么?
你们导师不管?我觉得你做得不错,可以尝试投 paper。
树根互联 AILab:
整体框架:Faster R-CNN + FPN(解决瑕疵尺度多样化问题)
backbone: ResNet101
GDUT-WWW:
什么是 aspect ratio?
评委提问:
- 能不能用一两句话简单陈述你们的创新点?
- 你说可以做迁移学习的其他任务,怎么做?
打怪升级:
《基于多尺度 Mask-RCNN 的瑕疵检测》
多尺度有助于检测小瑕疵。也就是将一张图片分别 resize 到不同尺寸。
soft-NMS 可以解决重叠框误删的问题。
box voting。
- 说一下整个方法里面,哪一步是创新的?
- 铝板的缺陷检测为什么需要用 deep learning?传统的方法差在哪里?
Are you OK?
每个类别 bbox 数量的统计,及 bbox 大小的数量的统计:
- Deformable convolution 为什么能够对非规则的缺陷学得更好?那我用一个大的 kernel 一样可以把它覆盖住,覆盖住之后我让它学习到那个位置就行了呗?
FPN: Feature Pyramid Networks
SWA (Stochastic Weight Averaging )
网友评论