最近在做文本聚类和小样本图像分割,跑代码时,碰到了一些问题。总结如下:
1、loss 不收敛
将学习率改为指数衰减
2、冻结网络出现无参数可求导
观察冻结网络是否正确冻结
3、loss训练时变为负数
可能是梯度消失问题,看看网络中的某些部分能否求导
4、调参
一定要做好记录,因为每次实验都很耗时间,一个说不准就要重跑一遍。
最近在做文本聚类和小样本图像分割,跑代码时,碰到了一些问题。总结如下:
1、loss 不收敛
将学习率改为指数衰减
2、冻结网络出现无参数可求导
观察冻结网络是否正确冻结
3、loss训练时变为负数
可能是梯度消失问题,看看网络中的某些部分能否求导
4、调参
一定要做好记录,因为每次实验都很耗时间,一个说不准就要重跑一遍。
本文标题:常见深度学习问题一
本文链接:https://www.haomeiwen.com/subject/zzunxhtx.html
网友评论