美文网首页
Be Your Own Teacher: Improve the

Be Your Own Teacher: Improve the

作者: 晴窗细语 | 来源:发表于2020-04-02 16:10 被阅读0次

    自蒸馏整体网络结构:


    network

    其中,bottleneck可减轻每个浅分类器之间的影响,添加teacher隐藏层L2 loss,并且使teacher与student网络feature map输出大小一致。

    三个损失函数:

    • 交叉熵损失(从标签到最深分类器和浅分类器):根据数据集标签与分类器softmax输出进行计算
    • KL散度:计算teacher与student 之间的softmax
    • L2 loss:计算最深分类器与浅分类器feature map 之间的 L2 loss

    总体损失:

    loss
    C表示CNN中分类器个数


    其中,最深分类器的λ和α为零,即最深分类器的监督仅来自标签。

    注意

    • 自蒸馏存在梯度消失的问题,因此较深的神经网络较难训练
    • 自蒸馏一种提高模型性能的训练技术,而不是一种压缩模型的方法

    相关文章

      网友评论

          本文标题:Be Your Own Teacher: Improve the

          本文链接:https://www.haomeiwen.com/subject/babxphtx.html