前言
在使用Keras编程的时候,我们往往会将更多的精力放在如何解决实际的问题上面。由于Keras高层封装的好处,大部分低级的错误都被避免了,对学习来说减少了大量调试找错的时间。
那么在前面几篇文章里面,我们讲了如何使用Keras实现一个卷积网络的模型,并且通过TensorBoard来可视化模型训练过程,从而进行对模型的优化工作。那么现在则是时候将我们训练好的模型投入使用了。
保存模型
在Keras中,训练好的模型可以通过model.save
来将这个模型保存下来。
在程序的最后加入如下代码来将模型保存下来:
model.save('64x3-CNN.model')
再次运行程序,在程序文件所在的文件夹下可以发现出现了一个新的名为64x3-CNN.model的文件。这个文件也就是我们训练的模型的文件,该文件内保存着模型的结构和所有参数的具体数据。如果模型越复杂,那么文件的大小也会越大。
使用保存下来的模型进行分类
我们编写的模型是用来对猫和狗进行分类的CNN模型,且保存在了64x3-CNN.model文件内。
为了使用这个模型来实现分类,则需要再新建一个Python文件(或者是Jupyter Notebook)。为了实现分类功能,模型的新的输入的图片应该是在数据集内没有存在过的。
这里选择了网络上搜集到的猫和狗的照片,选用的分辨率比较低。


使用已有的模型预测的思路如下:首先是加载现有的待预测的图片,为了能让我们的卷积网络将已有的图片作为输入,需要将图片大小转换为前面定义的大小。然后通过keras.models.load_model将训练好且保存下来的模型加载,最后通过model.predict来进行预测。
因此,根据上面思路所编写的代码如下:
import cv2
import tensorflow as tf
categories = ['Dog', 'Cat']
def prepare(path):
img_size = 50
img_array = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
new_array = cv2.resize(img_array, (img_size, img_size))
return new_array.reshape(-1, img_size, img_size, 1)
model = tf.keras.models.load_model('64x3-CNN.model')
prediction = model.predict([prepare('dog.jpg')])
print(prediction)
通过运行之后,得到的输出为:
[[0.]]
也就是说,预测的结果是0,狗。同理,加载了猫的图片后,预测的结果是1,也就是猫。
将输出转换为字符串形式的分类。
prediction = model.predict([prepare('cat.jpg')])
print(categories[int(prediction[0][0])])
运行结果:
Cat
后记
至此,使用Keras编写CNN网络的教程已经结束了。
按照上一讲中模型训练的结果,准确率大概为80%,大家可以试着实现其他的卷积网络,来提高准确性。并且在更大的,类别更多的数据集上实现分类。
网友评论