基于TensorFlow的MNIST手写数字识别与Android

作者: qliu | 来源:发表于2017-04-27 22:31 被阅读2830次

SkySeraph AI 实践到理论系列
基于TensorFlow的MNIST手写数字识别与Android
TensorFlow实战：SoftMax手写体MNIST识别（P
基于tensorflow的MNIST手写数字识别（三）--神经
基于tensorflow的MNIST手写字识别（一）--白话卷
基于tensorflow的MNIST手写数字识别（二）--入门
【TensorFlow实战——笔记】第3章：TensorFlow
学习笔记TF024:TensorFlow实现Softmax Re
【转】Tensorflow 实现 MNIST 手写数字识别
OpenCV+Python识别车牌和字符分割

本文基于TensorFlow实现了MNIST手写数字识别，并将训练好的模型移植到了Android上。

环境配置

TensorFlow 1.0.1
Python2.7
Android Studio 2.2

主要步骤

生成pb文件：使用TensorFlow Python API 构建并训练网络，最后将训练后的网络的拓扑结构和参数保存为pb文件。
构建jar包和so库：TensorFlow Android Inference Interface提供了名为org.tensorflow.contrib.android.TensorFlowInferenceInterface的Java类，使得开发者可以在Android平台上加载TensorFlow graphs，完成本地识别。
将pb文件、jar包以及so库引入Android工程中，并基于TensorFlowInferenceInterface类完成识别。

移植过程

一、生成pb文件

pb文件中保存了网络的拓扑结构和参数。为了得到pb文件需要先基于TensorFlow Python API 构建并训练网络。

1. 给网络拓扑中的关键节点指定名称

网络的输入节点和输出节点在使用tf.placeholder定义的时候必须要通过name形参指定名称，便于在将模型移植到Android后可以通过名称来获取指定节点的值，或者给指定节点赋值。

x = tf.placeholder(tf.float32, [None, height, width], name='input')  #输入节点的名字这里取名为'input'
sofmax_out = tf.nn.softmax(logits,name="out_softmax") #输出节点
# keep_prob_placeholder这个节点也命名了，便于后期用于区分训练和测试。
keep_prob_placeholder = tf.placeholder(tf.float32, name='keep_prob_placeholder')

2. 将训练好后的网络模型保存为pb文件

这是通过convert_variables_to_constants(sess, input_graph_def, output_node_names,variable_names_whitelist=None)函数实现的，该函数的定义见这。
convert_variables_to_constants完成如下两件事情：（@mirosval的回答）

convert_variables_to_constants()
does two things:
It freezes the weights by replacing variables with constants
It removes nodes which are not related to feedforward prediction

from tensorflow.python.framework import graph_util

constant_graph = graph_util.convert_variables_to_constants(sess, sess.graph_def, ["out_softmax"])
with tf.gfile.FastGFile(pb_file_path,mode='wb') as f:
    f.write(constant_graph.SerializeToString())

二、构建jar包和so库

详细的构建过程可以参考官网：https://github.com/tensorflow/tensorflow/tree/r1.0/tensorflow/contrib/android

这里简要地总结一下主要步骤。

1. 安装 Bazel,Android NDK,Android SDK

Bazel的安装参考官网

2. 下载TensorFlow源码，修改项目根目录下的WORKSPACE文件

本文下载的是TensorFlow 1.0.1。
修改WORKSPACE文件中的Android SDK和Android NDK的配置信息，其中的路径等信息根据之前的安装情况进行修改。
本文将WORKSPACE文件的配置修改如下：

# Uncomment and update the paths in these entries to build the Android demo.
android_sdk_repository(
    name = "androidsdk",
    api_level = 25,
    build_tools_version = "25.0.2",
    # Replace with path to Android SDK on your system
    path = "/home/tsiangleo/android_dev/tool/android-sdk-linux",
)

android_ndk_repository(
    name="androidndk",
    path="/home/tsiangleo/android_dev/tool/android-ndk-r13b",
    api_level=21)

3. 构建so库

在TensorFlow源码的根目录下执行如下命令，构建so库。

bazel build -c opt //tensorflow/contrib/android:libtensorflow_inference.so \
   --crosstool_top=//external:android/crosstool \
   --host_crosstool_top=@bazel_tools//tools/cpp:toolchain \
   --cpu=armeabi-v7a

构建成功后，可在如下目录找到so库。

bazel-bin/tensorflow/contrib/android/libtensorflow_inference.so

4. 构建jar包

在TensorFlow源码的根目录下执行如下命令，构建jar包。

bazel build //tensorflow/contrib/android:android_tensorflow_inference_java

构建成功后，可在如下目录找到jar包。

bazel-bin/tensorflow/contrib/android/libandroid_tensorflow_inference_java.jar

三、整合到Android Studio工程

以下操作针对Android Studio。

1.将pb文件放入Android项目中

打开 Project view ，app/src/main/assets。
若不存在assets目录，右键main->new->Directory，输入assets。

2.将jar包引入Android项目中

打开Project view，将jar包拷贝到app->libs下
选中jar文件，右键 add as library

3.将so库引入Android项目中

打开 Project view，将libtensorflow_inference.so文件拷贝到 app/src/main/jniLibs/armeabi-v7a下（若jniLibs/armeabi-v7a目录不存在，则先创建，方法同1。）。

4.基于TensorFlowInferenceInterface类，编写代码进行识别。

在TensorFlow1.0中，TensorFlowInferenceInterface类的定义为： https://github.com/tensorflow/tensorflow/blob/r1.0/tensorflow/contrib/android/java/org/tensorflow/contrib/android/TensorFlowInferenceInterface.java
该类的用法可参官网的TensorFlowImageClassifier示例。

下面以识别MNIST手写数字为例来介绍，具体代码见github。

（1）定义一些关键的常量

    public static final String MODEL_FILE = "file:///android_asset/mnist-tf1.0.1.pb"; //asserts目录下的pb文件名字
    public static final String INPUT_NODE = "input";       //输入节点的名称
    public static final String OUTPUT_NODE = "out_softmax";  //输出节点的名称
    public static final String KEEP_PROB_NODE = "keep_prob_placeholder"; // keep_prob节点的名称

    public static final int NUM_CLASSES = 10;   //输出节点的个数，即总的类别数。
    public static final int HEIGHT = 28;       //输入图片的像素高
    public static final int WIDTH = 28;        //输入图片的像素宽

（2）创建`TensorFlowInferenceInterface`对象并初始化

        //初始化TensorFlowInferenceInterface对象。
        TensorFlowInferenceInterface inferenceInterface = new TensorFlowInferenceInterface();

        //根据指定的MODEL_FILE创建一个本地的TensorFlow session
        inferenceInterface.initializeTensorFlow(context.getAssets(), MODEL_FILE);

（3）输入图片的像素点，得到分类结果

        // 输入数据pixelArray，pixelArray的数据类型是float[]，存放了一张图片的像素点。
        inferenceInterface.fillNodeFloat(INPUT_NODE, new int[]{1, HEIGHT, WIDTH}, pixelArray);
        inferenceInterface.fillNodeFloat(KEEP_PROB_NODE,new int[]{1},new float[]{1.0f});

        //进行模型的推理
        inferenceInterface.runInference(new String[]{OUTPUT_NODE});

        //获取图片属于各个分类的概率，存放在outputs数组中。
        float[] outputs = new float[NUM_CLASSES];    //用于存储模型的输出数据
        inferenceInterface.readNodeFloat(OUTPUT_NODE, outputs); //获取输出数据

本文源码

网络模型的创建及训练
https://github.com/tsiangleo/TensorFlowMnist
将训练好的模型移植到Android项目中
https://github.com/tsiangleo/TensorFlowMnistAndroidDemo
MNIST Android项目的运行效果如下：

Mnist在Android上的运行效果

参考文档

网友评论

67d36c4d28a3:大佬你好，想问关于keep_prob。。。
第一个问题，浏览下大佬的训练源码，好像只有一个dropout层是吗？
第二个，如果网络有多个droput层，每个dropout层都需要指定一个对应的keep_prob_placeholder吗？
第三个，inferenceInterface.fillNodeFloat(KEEP_PROB_NODE,new int[]{1},new float[]{1.0f}); 这句是就是让原来的dropout失效吗？
第四个，如果网络包含多个dropout层，应用到android上的时候，都需要像第三个问题那样去设置吗？

期待你的回复
f80b74aa5dcf:convert_variables_to_constants 这个函数，怎么知道output_node_names的值呢？
我遇到以下错误：AssertionError: out_softmax is not in graph
qliu: @张利高就是你在前面定义网络拓扑时给输出节点指定的那个名称。

本文标题：基于TensorFlow的MNIST手写数字识别与Android

本文链接：https://www.haomeiwen.com/subject/immwzttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！