美文网首页
From 铝型材表面瑕疵识别比赛总决赛答辩视频:

From 铝型材表面瑕疵识别比赛总决赛答辩视频:

作者: oneoverzero | 来源:发表于2020-02-16 09:08 被阅读0次

视频链接:https://tianchi.aliyun.com/course/video?spm=5176.12586971.1001.25.41ac2881DxCw7l&liveId=36945

shuzhilian ai:

总共有十种瑕疵类别,首先要分析每一种瑕疵类别的样本数目各是多少,由此得出样本分布是不均衡的:

20200215-1.PNG

所以首先要用图像处理的方法做数据增强,把每一类样本增加到 5000 份左右。

接着还要统计缺陷的尺寸分布情况:

20200215-2.PNG

尺寸变化非常大。针对这一问题采用的结构是 Faster RCNN + FPN + Cascade RCNN。

因此整体的方法是:

20200215-3.PNG

先做数据增强,然后再采用上述的架构,backbone: ResneXt152。

针对不同尺寸的缺陷所做的改进:

20200215-4.PNG

Cascade RCNN 结构:

20200215-5.PNG

小结:

20200215-6.PNG

评委提问:

  • 问题 1. 你改进了三个部分,我想知道哪个部分的改进对你整个算法的性能的提高最有效?
  • 问题 2. 你用了 Cascade RNN 结构,这个东西如何保证收敛?它可能会越变越差。
  • 问题 3. 这个题目在出的时候没有给你们负样本,你们负样本自己取的方式再简介一下,然后取完这个负样本后对你们性能的提升是一个什么程度?
  • 问题 4. 在没有其他新增样本的条件下,你们在做数据增强的时候,你认为到多少量,或者说数据增强多少倍的时候,大概会到一个比较稳定的、可能没法再提升的程度?

风不动:

将各种缺陷的图像展示了出来:

20200215-7.PNG

并分析了所给数据的特点:

20200215-8.PNG

FPN 结构可以适应更多的大小尺度。

针对不规则和微小目标的检测方案:(Detection for Irregular and Tiny Objects, DIT)

DCN: Deformable Convolutional Networks

什么是 ROIPooling?什么是 ROIAlign?为什么后者比前者的效果好?

什么是 anchor?

什么是 hard example mining?什么是 OHEM?什么是 batch 级别的 OHEM?

测试阶段:什么是 NMS?什么是 Soft-NMS?什么是投票平均?

20200215-9.PNG

总结:

20200215-10.PNG

评委提问:

  • 我看你们三个是北邮的学生,那你们参加这个比赛的目的是什么?

    你们导师不管?我觉得你做得不错,可以尝试投 paper。

树根互联 AILab:

整体框架:Faster R-CNN + FPN(解决瑕疵尺度多样化问题)

backbone: ResNet101

GDUT-WWW:

什么是 aspect ratio?

评委提问:

  • 能不能用一两句话简单陈述你们的创新点?
  • 你说可以做迁移学习的其他任务,怎么做?

打怪升级:

《基于多尺度 Mask-RCNN 的瑕疵检测》

20200215-11.PNG

多尺度有助于检测小瑕疵。也就是将一张图片分别 resize 到不同尺寸。

soft-NMS 可以解决重叠框误删的问题。

box voting。

20200215-12.PNG
  • 说一下整个方法里面,哪一步是创新的?
  • 铝板的缺陷检测为什么需要用 deep learning?传统的方法差在哪里?

Are you OK?

每个类别 bbox 数量的统计,及 bbox 大小的数量的统计:

20200215-13.PNG
  • Deformable convolution 为什么能够对非规则的缺陷学得更好?那我用一个大的 kernel 一样可以把它覆盖住,覆盖住之后我让它学习到那个位置就行了呗?

FPN: Feature Pyramid Networks

SWA (Stochastic Weight Averaging )

相关文章

网友评论

      本文标题:From 铝型材表面瑕疵识别比赛总决赛答辩视频:

      本文链接:https://www.haomeiwen.com/subject/abxpfhtx.html