美文网首页
知识蒸馏

知识蒸馏

作者: 一颗大葡萄树 | 来源:发表于2020-07-14 17:06 被阅读0次

最近在实验用MobilenetV3在分类数据集上的效果,想起了Hinton之前搞过的知识蒸馏模型来训练小网络。简而言之就是使用复杂计算量大的深度学习模型的预测值来更新小模型,使小模型准确率达到大模型的效果。该网络引入了暗知识的信息,使用大网络的输出信息加上温度信息更新小网络。引入alpha参数,loss1×(1-alpha)+loss2×alpha作为网络训练时使用的loss,训练网络。

相关文章

  • 【技术博客】通过量化知识来解释知识蒸馏

    【技术博客】****通过量化知识来解释知识蒸馏 知识蒸馏介绍 知识蒸馏(Knowledge Distillatio...

  • 知识蒸馏

    知识蒸馏(Knowledge Distillation): 知识蒸馏即将知识从「教师」模型迁移到「学生」模型,执行...

  • 知识蒸馏

    最近在实验用MobilenetV3在分类数据集上的效果,想起了Hinton之前搞过的知识蒸馏模型来训练小网络。简而...

  • 知识蒸馏

    知识蒸馏是什么?一份入门随笔 - LinT的文章 - 知乎https://zhuanlan.zhihu.com/p...

  • 知识蒸馏

    一、简介 https://zhuanlan.zhihu.com/p/258721998[https://zhuan...

  • 一分钟带你认识深度学习中的知识蒸馏

    摘要:知识蒸馏(knowledge distillation)是模型压缩的一种常用的方法 一、知识蒸馏入门 1.1...

  • 知识蒸馏论文

    Romero, A.; Ballas, N.; Kahou, S. E.; Chassang, A.; Gatta...

  • 知识蒸馏-简单

    参考文献: https://github.com/DA-southampton/NLP_ability/blob/...

  • 让BERT飞一会

    [TOC] 1. 模型蒸馏 1. DistilBERT(2019.10.2) 知识蒸馏的基础原理: 定义两个网络,...

  • 蒸馏学习

    知识蒸馏解决的问题 提升模型精度 降低模型时延,压缩网络参数 标签之间的域迁移 基本框架 知识蒸馏采取Teache...

网友评论

      本文标题:知识蒸馏

      本文链接:https://www.haomeiwen.com/subject/dzuxhktx.html