这篇文章接着上篇文章接着讲
上一篇结尾处,我们已经开始训练了。但是出现了很多的问题比如
训练次数多的情况下
loss 为 nan
在评估模型的时候总是报错等
loss为nan
这是因为,自己的学习率太大,比如是 0.001
现在需要把学习率变小,就是0.0001
从新跑了一次就没有这个问题了
第二个问题是在评估模型的时候
python eval.py
首先我先下载到本地,就行测试,但是发现总是报错
感觉是因为本地没有GPU的问题,之后我在云上进行训练的时候就没出现了这样的错误了。
但是给我报了个
KeyError: 'bsg'
一开始我以为是我那个代码的问题,最后才发现是自己的标注的问题。
原来有个标注中吧bag
写成了bsg
改好后就可以运行了。
评估结果在进一步训练过程
发现loss自己训练过程中降低到一个水平后就不再降低了。
网友评论