超简单！pytorch入门教程（五）：训练和测试CNN

作者: Zen_君 | 来源:发表于2017-02-06 23:00 被阅读17303次

我们按照超简单！pytorch入门教程（四）：准备图片数据集准备好了图片数据以后，就来训练一下识别这10类图片的cnn神经网络吧。

按照超简单！pytorch入门教程（三）：构造一个小型CNN构建好一个神经网络，唯一不同的地方就是我们这次训练的是彩色图片，所以第一层卷积层的输入应为3个channel。修改完毕如下：

我们准备了训练集和测试集，并构造了一个CNN。与之前LeNet不同在于conv1的第一个参数1改成了3

现在咱们开始训练

我们训练这个网络必须经过4步：

第一步：将输入input向前传播，进行运算后得到输出output

第二步：将output再输入loss函数，计算loss值（是个标量）

第三步：将梯度反向传播到每个参数

第四步：利用下面公式进行权重更新

新权重w = 旧权重w + 学习速率𝜂 x 梯度向量g

非常幸运，pytorch帮我们写好了计算loss的函数和优化的函数。

我们先初始化loss和优化函数：

criterion = nn.CrossEntropyLoss() #叉熵损失函数

optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9) #使用SGD（随机梯度下降）优化，学习率为0.001，动量为0.9

待会我们就要用到这两个函数

假设我们需要对训练数据完全遍历两次，人话就是：我们把所有训练集的数据扔进去进行训练，但是扔一次怎么够呢，扔一次并不能保证我的网络的参数就训练的很完美了，那么我们就会反复将训练集的数据扔进去训练，每次扔的时候，数据的顺序是不一样的。

这里我们就先扔两次练练。

训练网络

先不管running_loss，它是我们待会用来统计loss的平均值的。

我们先看data，data是从trainloader中枚举出来的，数据的结构看上面注释。

我们在训练前，会将网络中每个参数的grad值清空为0，这样做是因为grad值是累加的具体参考pytorch学习笔记（二），设置为0后，每次bp后的grad更新后的值才是正确的。

我们将inputs输入net之后，得到outputs，将outputs和labels输入之前定义的叉熵函数计算loss值。除了叉熵方式计算外还有其他计算loss的方法。

loss算完后，我们就使用backward向后传播啦！我们稍微想一下传播会怎么进行，传播应该会让每一个网络参数的grad值进行更新，我们网络中的每一个参数都是Variable类型，并且均是叶子节点，grad值必然会进行更新。

接下来，每个参数利用自身的grad值进行梯度下降法的更新就好了，我们利用先前定义好的optimizer使用step()函数进行更新。其他优化方法

好了！讲了这么久，我们将代码下载下来溜溜，看看是什么情况！下载cnn.py

如果没错的话，跑完你应该会看到下图（loss平均值每次跑都会有变化的，因为咱们的loader设置了shuffle=True）：

如图，我们的训练数据被我们扔进去了两遍，而且每2000批数据我们打印一次平均loss值，请注意不断减小的loss值，证明我们的网络正在被优化啊！！！！

好了，训练完之后，我们当然我测试一下我们的网络的分类的正确率到底是多少

上代码：

测试部分

关于total值我们可以设为10000，因为我们知道训练集中的图片数量就是10000，但是为了泛化，我们还是老老实实的点人头。一开始我们设置correct和total都为0。

我们要计算正确率，就用

正确数／全部数量

我解释一下第92行代码，outputs.data是一个4x10张量，max函数会将每一行的最大的那一列的值和序号各自组成一个一维张量返回，第一个是值的张量，第二个是序号的张量。我想还是举个例子吧：

随机生成了4x10的tensor，然后max函数会帮我们挑出每一行最大的那个值，比如第一行第10个，第二行是第9个，第三行是第5个，第四行是第10个。而[9,8,5,9]正是表示这些数的位置（从0开始算）

那么为啥输出的outputs是个4x10的张量呢，我们试着想一下，假设我们现在输入的是一张图片，那么出来的是一个10维的特征向量，因为我们同时输入了4张，所以就是4x10啦！

第93行，我们的labels是4维的向量，size(0)就是4，即没次total都加4。

第94行，两个4维向量逐行对比，相同的行记为1，不同的行记为0，再利用sum(),求各元素总和，得到相同的个数。这个不懂也可以自己命令行上试试：

只有第1和第3个元素相同，使用sum的话则会等于2。

完整代码在这，我们下载后跑一下：

正确率为52%

童鞋们可以看到，训练2遍结果是不够好的，才52%！大家可以回去把循环次数2改成10试试。

pytorch入门教程就到这里吧😄，Zen君继续操练去了。

网友评论

景凌林:还有一个问题，为什么输入的图片是有十维的特征向量呢？

景凌林:谢谢大神，有一个问题，如果我想载入两个数据库比如CIFAR-10和MNIST并训练，然后自由输入图片来测试准确率。但是他们的像素是不一样的，我该如何处理像素问题？

木槿_d14b:你好我下载了cifar-10数据集可是解压之后有六个文件在那个root上面我如何填路径呢

木槿_d14b:你好我想用这个实现一下对人脸的评分如何实现呢？为啥输出会是一个评分呢?

瞿港:真的是解惑了，但是还是有两个问题 torch.max()第二个参数是1 代表了什么? 第二个问题是，如果我fc2那一层得到4*84的tensor 我想把这个单独调用分成1*84 和3*84 的两个numpy 应该怎么做

Zen_君:@瞿港 max地第二个参数1是指最大值。

Zen_君:@瞿港因为“学习”是受到学习率的微小幅度的调整，一次的步长其实很小，通过多次循环可以一步步迈进最低点

瞿港:为什么多次遍历数据集可以提高精确度呢，training data没有变化啊

还在努力:大神你好，想请教下如何用GPU去训练和预测

Zen_君:@inception循序渐进很简单,只要令data, target = data.cuda(), target.cuda()

df736d0e1abf:非常有用！！！

75bff2a49fe3:请教一下，我把训练的次数调大了一些，发现loss值在50次左右前是一直减小的，但之后逐渐增大，200多次后就初始偏差值差不多了，重复多次依旧。
按到道理，重复次数过多会过拟合导致结果准确度下降可以理解，但是偏差值应该是随着训练次数的增加逐渐收敛的啊，为什么是越来越大呢？

深度智心:有个pytorch交流群，大家可以进去交流，637638632

e72c32059b22:大神您好，看了您的文章受益匪浅，自己试着安装了pytorch，然后跑了examples里的mnist例程，自己想输入一张图片，然后识别出这张图片的数字，不知道该怎么做，能否讲解下？

深度智心:有个pytorch交流群，大家可以进去交流，637638632

e72c32059b22:@Zen_君大概明白您的意思了，我试试去，谢谢

Zen_君:@miracle_d329 训练的请参考这一篇和第三篇，训练完之后，你可以把参数保存到硬盘，你再输入未标注的图片，加载硬盘的参数，输出的output值是一个向量，这个向量是10维的（按照你的分类数量定的），你就看看第几维的向量元素最大，就把图片分成第几类。比如第一个元素是代表数字0，而且第一个元素的值恰恰是最大的，那么我们就认为图片是0。

景凌林:还有一个问题，为什么输入的图片是有十维的特征向量呢？
景凌林:谢谢大神，有一个问题，如果我想载入两个数据库比如CIFAR-10和MNIST并训练，然后自由输入图片来测试准确率。但是他们的像素是不一样的，我该如何处理像素问题？
木槿_d14b:你好我下载了cifar-10数据集可是解压之后有六个文件在那个root上面我如何填路径呢
木槿_d14b:你好我想用这个实现一下对人脸的评分如何实现呢？为啥输出会是一个评分呢?
瞿港:真的是解惑了，但是还是有两个问题 torch.max()第二个参数是1 代表了什么? 第二个问题是，如果我fc2那一层得到4*84的tensor 我想把这个单独调用分成1*84 和3*84 的两个numpy 应该怎么做
Zen_君:@瞿港 max地第二个参数1是指最大值。
Zen_君:@瞿港因为“学习”是受到学习率的微小幅度的调整，一次的步长其实很小，通过多次循环可以一步步迈进最低点
瞿港:为什么多次遍历数据集可以提高精确度呢，training data没有变化啊
还在努力:大神你好，想请教下如何用GPU去训练和预测
Zen_君:@inception循序渐进很简单,只要令data, target = data.cuda(), target.cuda()
df736d0e1abf:非常有用！！！
75bff2a49fe3:请教一下，我把训练的次数调大了一些，发现loss值在50次左右前是一直减小的，但之后逐渐增大，200多次后就初始偏差值差不多了，重复多次依旧。
按到道理，重复次数过多会过拟合导致结果准确度下降可以理解，但是偏差值应该是随着训练次数的增加逐渐收敛的啊，为什么是越来越大呢？
深度智心:有个pytorch交流群，大家可以进去交流，637638632
e72c32059b22:大神您好，看了您的文章受益匪浅，自己试着安装了pytorch，然后跑了examples里的mnist例程，自己想输入一张图片，然后识别出这张图片的数字，不知道该怎么做，能否讲解下？
深度智心:有个pytorch交流群，大家可以进去交流，637638632
e72c32059b22:@Zen_君大概明白您的意思了，我试试去，谢谢
Zen_君:@miracle_d329 训练的请参考这一篇和第三篇，训练完之后，你可以把参数保存到硬盘，你再输入未标注的图片，加载硬盘的参数，输出的output值是一个向量，这个向量是10维的（按照你的分类数量定的），你就看看第几维的向量元素最大，就把图片分成第几类。比如第一个元素是代表数字0，而且第一个元素的值恰恰是最大的，那么我们就认为图片是0。

超简单！pytorch入门教程（五）：训练和测试CNN

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

神经网络与深度学习

深度学习

PyTorch

深度学习·神经网络·计算机视觉

机器学习

Pytorch

pytorch

Pytorch