Python深度学习6-迁移学习图像识别实战

作者: 西萌XXX | 来源:发表于2022-05-13 12:30 被阅读0次

Python深度学习6-迁移学习图像识别实战
Keras图像深度学习实战
Successful Identification of Nas
福利 | Keras入门之——网络层构造
迁移学习之_猫狗大战
Python深度学习5-图像识别实战
深度学习的最开始---2
别磨叽，学完这篇你也是图像识别专家了
6-机器学习启蒙- 深度学习: 图像搜索
【火炉炼AI】深度学习009-用Keras迁移学习提升性能（多分

1、准备工作

本文将迁移经典模型Resnet进行花的识别，花数据集下载地址https://frenzy86.s3.eu-west-2.amazonaws.com/IFAO/flowers.zip。Resnet使用介绍网址https://keras.io/api/applications/resnet/，可查看一下图像数据的输入大小和维度。
导入所要用的包，解压数据集

from tensorflow.keras.layers import Conv2D,Dense,MaxPool2D,BatchNormalization,GlobalAveragePooling2D
from tensorflow.keras.applications.resnet50 import preprocess_input,decode_predictions
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img
from tensorflow.keras.optimizers import Adam,Adadelta
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.preprocessing import image
from tensorflow.keras.models import Sequential, Model, load_model
import matplotlib.pyplot as plt
import numpy as np
##pip install splitfolders
import splitfolders

##使用splitfolders对鲜花数据集拆分成训练集和测试集
input_folder = 'flowers/'
output_folder = 'processed_data/'
train_data_dir = 'processed_data/train'
validation_data_dir = 'processed_data/val'
test_data_dir = 'processed_data/test'
splitfolders.ratio(input_folder,output_folder,seed=667,ratio=(.6,.2,.2))

2、使用ImageDataGenerator类进行图像数据集处理


img_height, img_width = (224,224)  ##Resnet所需的输入数据大小
batch_size = 16
train_datagen = ImageDataGenerator(preprocessing_function=preprocess_input,
                                    shear_range=0.2,
                                    zoom_range=0.2,
                                    horizontal_flip=True,
                                    validation_split=0.4
                                    )
train_generator = train_datagen.flow_from_directory(
                train_data_dir,
                target_size = (img_height,img_width),
                batch_size = batch_size,
                class_mode = 'categorical',
                subset='training')   # 训练集

valid_generator = train_datagen.flow_from_directory(
                validation_data_dir,
                target_size = (img_height,img_width),
                batch_size = batch_size,
                class_mode = 'categorical',
                subset='validation')  # 验证集

test_generator = train_datagen.flow_from_directory(
                test_data_dir,
                target_size = (img_height,img_width),
                batch_size = 1,
                class_mode = 'categorical',
                subset='validation')  # 测试集

3、调用Resnet进行模型训练

##训练标签数据
X,y = test_generator.next()
base_model = ResNet50(include_top=False,weights='imagenet')
X = base_model.output
X = GlobalAveragePooling2D()(X)
X = Dense(1024, activation='relu')(X)
###num_classes 多少类别 5个
predictions = Dense(train_generator.num_classes, activation='softmax')(X)
model = Model(inputs=base_model.input,outputs=predictions)
model.compile(optimizer=Adam(lr=0.0001),loss='categorical_crossentropy',metrics = ['accuracy'])
history = model.fit(train_generator, 
                    epochs=10,
                    shuffle = True,
                    validation_data=valid_generator,
                    #validation_steps=2,
                    )

4、模型的保存验证测试

model.save('ResNet50_flowers.h5')
test_loss, test_acc = model.evaluate(test_generator, verbose=2)
print('\nTest accuracy ', test_acc)

import pandas as pd
import seaborn as sns
model = load_model('ResNet50_flowers.h5')
filenames = test_generator.filenames
nb_samples = len(test_generator)

y_prob =[]
y_act = []
test_generator.reset()

for _ in range (nb_samples):
    X_test,y_test = test_generator.next()
    y_prob.append(model.predict(X_test))
    y_act.append(y_test)

predicted_class = [list(test_generator.class_indices.keys())[i.argmax()] for i in y_prob]
actual_class = [list(test_generator.class_indices.keys())[i.argmax()] for i in y_act]

test_df = pd.DataFrame(np.vstack([predicted_class,actual_class]).T, 
                        columns=['predicted_class','actual_class'])

测试集中模型识别结果和实际结果

5 、测试新图片

测试图片下载地址https://frenzy86.s3.eu-west-2.amazonaws.com/IFAO/test_images.zip


import os
lista = os.listdir('test_images/') #['rose.jpg', 'sunflower.jpg', 'dandelion.jpg', 'tulip.jpg', 'daisy.jpg']

# {'daisy': 0, 'dandelion': 1, 'rose': 2, 'sunflower': 3, 'tulip': 4}
classes = {0:"daisy",
           1:"dandelion",
           2:"rose",
           3:"sunflower",
           4:"tulip",          
           }

finale=[]
name = []
res = []
for i in lista:
    path = 'test_images/' + i
    img = image.load_img(path, target_size=(224, 224))
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)
    images = np.vstack([x])
    pred = model.predict(images, batch_size=10)
    print(pred)
    result = np.argmax(pred, axis=-1)[0]
    print(result)
    name.append(i)
    finale.append(result)
    res.append(classes[result])

finale
print(name)
print(res)

完整代码如下

from tensorflow.keras.layers import Conv2D,Dense,MaxPool2D,BatchNormalization,GlobalAveragePooling2D
from tensorflow.keras.applications.resnet50 import preprocess_input,decode_predictions
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img
from tensorflow.keras.optimizers import Adam,Adadelta
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.preprocessing import image
from tensorflow.keras.models import Sequential, Model, load_model
import matplotlib.pyplot as plt
import numpy as np
##pip install splitfolders
import splitfolders

##使用splitfolders对鲜花数据集拆分成训练集和测试集
input_folder = 'flowers/'
output_folder = 'processed_data/'
train_data_dir = 'processed_data/train'
validation_data_dir = 'processed_data/val'
test_data_dir = 'processed_data/test'
splitfolders.ratio(input_folder,output_folder,seed=667,ratio=(.6,.2,.2))

img_height, img_width = (224,224)  ##Resnet所需的输入数据大小
batch_size = 16
train_datagen = ImageDataGenerator(preprocessing_function=preprocess_input,
                                    shear_range=0.2,
                                    zoom_range=0.2,
                                    horizontal_flip=True,
                                    validation_split=0.4
                                    )
train_generator = train_datagen.flow_from_directory(
                train_data_dir,
                target_size = (img_height,img_width),
                batch_size = batch_size,
                class_mode = 'categorical',
                subset='training')   # 训练集

valid_generator = train_datagen.flow_from_directory(
                validation_data_dir,
                target_size = (img_height,img_width),
                batch_size = batch_size,
                class_mode = 'categorical',
                subset='validation')  # 验证集

test_generator = train_datagen.flow_from_directory(
                test_data_dir,
                target_size = (img_height,img_width),
                batch_size = 1,
                class_mode = 'categorical',
                subset='validation')  # 测试集

X,y = test_generator.next()
base_model = ResNet50(include_top=False,weights='imagenet')
X = base_model.output
X = GlobalAveragePooling2D()(X)
X = Dense(1024, activation='relu')(X)
predictions = Dense(train_generator.num_classes, activation='softmax')(X)
model = Model(inputs=base_model.input,outputs=predictions)
model.compile(optimizer=Adam(lr=0.0001),loss='categorical_crossentropy',metrics = ['accuracy'])
history = model.fit(train_generator, 
                    epochs=10,
                    shuffle = True,
                    validation_data=valid_generator,
                    #validation_steps=2,
                    )

model.save('ResNet50_flowers.h5')
test_loss, test_acc = model.evaluate(test_generator, verbose=2)
print('\nTest accuracy ', test_acc)

import pandas as pd
import seaborn as sns
model = load_model('ResNet50_flowers.h5')
filenames = test_generator.filenames
nb_samples = len(test_generator)

y_prob =[]
y_act = []
test_generator.reset()

for _ in range (nb_samples):
    X_test,y_test = test_generator.next()
    y_prob.append(model.predict(X_test))
    y_act.append(y_test)

predicted_class = [list(test_generator.class_indices.keys())[i.argmax()] for i in y_prob]
actual_class = [list(test_generator.class_indices.keys())[i.argmax()] for i in y_act]

test_df = pd.DataFrame(np.vstack([predicted_class,actual_class]).T, 
                        columns=['predicted_class','actual_class'])

import os
lista = os.listdir('test_images/') #['rose.jpg', 'sunflower.jpg', 'dandelion.jpg', 'tulip.jpg', 'daisy.jpg']

# {'daisy': 0, 'dandelion': 1, 'rose': 2, 'sunflower': 3, 'tulip': 4}
classes = {0:"daisy",
           1:"dandelion",
           2:"rose",
           3:"sunflower",
           4:"tulip",          
           }

finale=[]   
name = []
res = []
for i in lista:
    path = 'test_images/' + i
    img = image.load_img(path, target_size=(224, 224))
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)
    images = np.vstack([x])
    pred = model.predict(images, batch_size=10)
    print(pred)
    result = np.argmax(pred, axis=-1)[0]
    print(result)
    name.append(i)
    finale.append(result)
    res.append(classes[result])

finale
print(name)
print(res)

Python深度学习6-迁移学习图像识别实战
1、准备工作本文将迁移经典模型Resnet进行花的识别，花数据集下载地址https://frenzy86.s3....
Keras图像深度学习实战
Keras图像深度学习实战 [tag]Keras,图像识别,深度学习,数挖掘,算法, [content]一本不可多...
Successful Identification of Nas
深度学习图像识别
福利 | Keras入门之——网络层构造
《Keras快速上手：基于Python的深度学习实战》系统地讲解了深度学习的基本知识、建模过程和应用，并以深度学习...
迁移学习之_猫狗大战
1. 迁移学习迁移学习（transfer learning）是指将已经学习的知识应用到其它领域，在图像识别问题...
Python深度学习5-图像识别实战
猫狗数据集地址链接：https://pan.baidu.com/s/1l6slkXqBrk87aiybcEkJ_Q...
深度学习的最开始---2
深度学习的最开始---2 4:实战 > 语言：python > ide: pycharm 1 : Percepto...
别磨叽，学完这篇你也是图像识别专家了
图像识别是当今深度学习的主流应用，而Keras是入门最容易、使用最便捷的深度学习框架，所以搞图像识别，你也得强调速...
6-机器学习启蒙- 深度学习: 图像搜索
6- 深度学习: 图像搜索 github: https://github.com/mtianyan/graphLa...
【火炉炼AI】深度学习009-用Keras迁移学习提升性能（多分
【火炉炼AI】深度学习009-用Keras迁移学习提升性能（多分类问题） (本文所使用的Python库和版本号: ...