美文网首页
网络训练tips( updating)

网络训练tips( updating)

作者: pipizhou | 来源:发表于2019-06-21 14:51 被阅读0次

    1. GPU利用率很低,训练过程很慢

    • io卡住了,数据导入到内存速度太慢
    • 模型太小
    • 模型中存在耗时的步骤(比如本次项目中的otsu_method,需要遍历像素值寻找最大方差)
    解决方法:
    • 加大workers
    • 设置timer,看一下具体哪一步比较慢(是数据处理/还是model部分,forward/backward)
    • 针对上述第三个问题,解决方案是用矩阵优化,是计算并行化

    2. Label Smoothing Regularization(LSR) 标签平滑

    • 引入原因:一般情况下,在分类问题中label采用one-hot vector(如三分类中第2类,[0, 1, 0])
    • 适用条件:数据不充足,小部分数据标注有误
    • 原理:

      相当于在ground truth的分布中加入了随机噪声,为了便于计算,噪声服从均匀分布

    e.g.
    三分类问题,当e = 0.1:
    [0, 0, 1] --> [0, 0, 1]*(1-0.1) + 0.1/3 = [0.033, 0.033, 0.933]
    代码实现:

    def label_smoothing(labels, e=0):
        
    

    3. Resize

    训练时把图像的短边随机resize256-480,test的时候扩张图片尺寸(224->288, 299->363)----待试验

    相关文章

      网友评论

          本文标题:网络训练tips( updating)

          本文链接:https://www.haomeiwen.com/subject/mpvyqctx.html