美文网首页我爱编程
Tensorflow入門--Mnist手寫識別

Tensorflow入門--Mnist手寫識別

作者: 執迷_4869 | 来源:发表于2018-07-25 00:02 被阅读0次
    終於下定決心了,我要學Tensorflow!

    好比HelloWorld之于編程入門,對於複雜而神秘的Tensorflow世界,Mnist手寫識別問題是一個不錯的入門。訓練所需的數據集不大,算法對計算機性能要求不高,即使是我的三代i3 CPU、4G內存、老舊機械硬盤也可以順利運行。

    首先,我們先輸入以下代碼來下載數據集:

    #下載MNIST手寫數字訓練數據集
    import tensorflow.examples.tutorials.mnist.input_data as input_data
    mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
    

    本來的話,靠這兩行代碼就可以下載到數據集。然而,TensorFlow是谷歌的……
    擋路的我們繞著走。作為墻內的程序員,必須隨時做好**的準備。
    將文件%appdata%\Local\Programs\Python\Python35\Lib\site-packages\tensorflow\contrib\learn\python\learn\datasets\mnist.py的第38行改為:

    DEFAULT_SOURCE_URL = 'https://yann.lecun.com/exdb/mnist/' #修改為鏡像地址
    

    試試看,果然可以。速度還是蠻快的。於是可以繼續折騰了。

    import tensorflow as tf
    x = tf.placeholder(tf.float32, [None, 784]) 
    

    什麼是placeholder?placeholder(佔位符),表示Tensorflow中的任意量。與模型的變量Variable相區別,佔位符的值是從外部輸入的。
    在這裡,我們以圖像作為輸入,符號為x。由於圖像的數目是任意的,故張量的行數用“None”來表示。一幅圖像被展開為784維的向量,因此x為784列。

    W = tf.Variable(tf.zeros([784, 10])) #權重
    b = tf.Variable(tf.zeros([10])) #偏置
    y = tf.nn.softmax(tf.matmul(x, W) + b) #機器的預測
    y_ = tf.placeholder(tf.float32, [None, 10]) #標準答案
    cross_entropy = -tf.reduce_sum(y_ * tf.log(y)) #計算交叉熵
    

    模型很簡單。輸入x與權重W相乘后,加上偏置b,結果經過softmax函數處理就得到了輸出y。(由於我們只識別10種阿拉伯數字,因此對應的權重的列數為10。)很顯然,當輸入一幅圖時,輸出y的尺寸為一行十列。我們認為y中最大值的位置表示機器所識別出的數字。
    我們希望能找到一組不錯的權重和偏置,使得模型能準確識別輸入圖像,這里使用梯度下降法。

    train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy) #梯度下降
    init = tf.initialize_all_variables() #變量一定要初始化后才能使用
    sess = tf.Session()
    sess.run(init)
    

    通過以上代碼,我們順利定義了模型并初始化。接下來就可以開始訓練了。

    for i in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100) #每次訓練使用100個樣本
        sess.run(train_step, feed_dict = {x: batch_xs, y_: batch_ys}) #訓練
    

    最後我們可以評估模型。前面說過張量y中最大值的位置即是模型的預測值,我們可以使用argmax函數獲取最大值的位置。令argmax的第二個參數為1,表示在行方向尋找最大值。

    correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1)) 
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
    print("accuracy:%f"%(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels})))
    

    由於模型比較簡單,所以準確率並不高,在91%左右。

    相关文章

      网友评论

        本文标题:Tensorflow入門--Mnist手寫識別

        本文链接:https://www.haomeiwen.com/subject/mpkumftx.html