美文网首页
技巧 | 模型集成 (CNN)

技巧 | 模型集成 (CNN)

作者: biogeeker | 来源:发表于2020-09-12 10:16 被阅读0次

一般性方法

  • cross-validation
    采用10折交叉验证,10个 CNN 模型可以使用如下方式进行集成:

    • 对预测的结果的概率值进行平均,然后解码为具体字符
    • 对预测的字符进行投票,得到最终字符
  • dropout
    可以有效的缓解模型过拟合的情况,也可以在预测时增加模型的精度

  • TTA (Test Time Augmentation)

    • 数据扩增不仅可以在训练时使用,同样可以在预测时使用
    • 可以预测多次,然后对结果进行投票或平均
  • snapshot
    模型集成 - 只训练了一个 CNN 模型

    • 使用 cyclical learning rate 训练模型,并保存精度比较好的一些 checkpoint,最后将多个 checkpoint 进行模型集成

      • Single model (Left), Ensemble model (Right)
    • 由于 cyclical learning rate 的学习率周期性地增大和减少,因此 CNN 模型很有可能跳出当前的局部最优或全局最优进入另一个局部最优或全局最优

    • snapshot 可以在一定程度上提高模型精度,但需要更长的训练时间

简单总结

  • dropoutTTA 在所有场景中都可以发挥作用

  • 集成学习只能在一定程度上提高精度,并需要耗费较多的训练时间,建议先提高单模型精度,再考虑集成学习

参考

阿里天池 | 零基础 CV 实战 - 街景字符识别

相关文章

  • 技巧 | 模型集成 (CNN)

    一般性方法 cross-validation采用10折交叉验证,10个 CNN 模型可以使用如下方式进行集成:对预...

  • 图像识别模型学习

    大话CNN经典模型:AlexNet 大话CNN经典模型:VGGNet 大话CNN经典模型:LeNet 基于深度学习...

  • Tensorflow实现Neural Style

    最近深度学习里面最cool的一个模型CNN卷积神经网络,搞明白了cnn的基本模型之后,跑了几个CNN的模型,算是C...

  • CV-字符识别模型

    Pytorch构建CNN模型 Pytorch中构建CNN模型只需要定义好模型的参数和正向传播就可以,Pytorch...

  • Task3 字符识别模型

    前面学了背景及数据读取,今天开始模型的部分了。使用常用的卷积神经网络CNN,搭建个分类模型。 CNN介绍 CNN是...

  • 检测网络

    实例分割模型 Mask R-CNN 详解:从 R-CNN,Fast R-CNN,Faster R-CNN 再到 M...

  • pytroch学习(二十一)—C++(libTorch)调用py

    前言 当我们训练好一个CNN模型之后,可能要集成到项目工程中,或者移植到到不同的开发平台(比如Android, I...

  • 【NLP】TextCNN

    模型 四种模式 CNN-rand: 单词向量是随机初始化,向量随着模型学习而改变 CNN-static: 使用预训...

  • Caffe 架构学习-底层数据2

    Net 完整的CNN模型 模型描述文件(prototxt) 模型权重(caffemodel) Net中的Blob分...

  • 2018-12-27制作自己的数据集

    CNN tensorflow 学习笔记(六)- 用自己的数据集训练CNN模型 TFRecord数据集 python...

网友评论

      本文标题:技巧 | 模型集成 (CNN)

      本文链接:https://www.haomeiwen.com/subject/kiedahtx.html