最近在实验用MobilenetV3在分类数据集上的效果,想起了Hinton之前搞过的知识蒸馏模型来训练小网络。简而言之就是使用复杂计算量大的深度学习模型的预测值来更新小模型,使小模型准确率达到大模型的效果。该网络引入了暗知识的信息,使用大网络的输出信息加上温度信息更新小网络。引入alpha参数,loss1×(1-alpha)+loss2×alpha作为网络训练时使用的loss,训练网络。
最近在实验用MobilenetV3在分类数据集上的效果,想起了Hinton之前搞过的知识蒸馏模型来训练小网络。简而言之就是使用复杂计算量大的深度学习模型的预测值来更新小模型,使小模型准确率达到大模型的效果。该网络引入了暗知识的信息,使用大网络的输出信息加上温度信息更新小网络。引入alpha参数,loss1×(1-alpha)+loss2×alpha作为网络训练时使用的loss,训练网络。
本文标题:知识蒸馏
本文链接:https://www.haomeiwen.com/subject/dzuxhktx.html
网友评论