美文网首页
机器学习练手小项目--根据身高/体重判断胖瘦(移植到iPhone

机器学习练手小项目--根据身高/体重判断胖瘦(移植到iPhone

作者: Apple技术产品粉 | 来源:发表于2018-09-21 23:56 被阅读0次

    前言

    先上最终结果图,就是根据输入的身高和体重来判断胖瘦。这个程序使用TensorFlow创建模型和训练,然后导出.pb模型文件,最后利用CoreML导入iPhone中来进行识别。

    手纸 胖纸 正常

    不是有个BMI可以计算体型么?我知道,不是要联系一下机器学习相关内容么,不要在意那些细节。而且,机器预测的跟平常我们的认知都差不多。

    TensorFlow端

    下面潜入细节。首先从TensorFlow端说起。训练一个模型首先需要的就是数据,我利用的是自己生成的.csv文件。何为.csv文件?其实就是许多特征值通过逗号连接而已,我用的bmi.csv文件中有20000条数据,特征有3个,分别是身高、体重和胖瘦状态。

    因为身高、体重是处于线性回归的状态,即y=x*w+b的状态,那么我们就可以利用TensorFlow来创建一个线性回归的模型,关键代码如下:

    import tensorflow as tf

    w=tf.Variable(tf.Zero([2,3]))

    b=tf.Variable(tf.Zero([3]))

    相当于定义一个原始的w,b,然后交由神经网络迭代解出最佳的w和b的值。请注意w的shape为[2,3],这代表w为2*3的矩阵,为什么是2*3呢,首先让我们先定义容纳输入的容器:

    x=tf.placeholder(tf.float32,[None,2],name="x_input")

    因为我们需要输入的变量为身高和体重,所以肯定是2列,行数随着数据数量而定,所以设为None,意思是看数据而定。因为x*w是矩阵运算,第一个矩阵的列数一定要和第二个矩阵的行数相等,所以x的列数为2,那么w的行数一定也要为2,那么列数为什么是3呢?因为输出是瘦、正常、胖的各自的概率,所以肯定是3列,所以这个3,包括b的shape为3,都是为了输出y服务的.

    再定义一个y_来容纳真实标签(胖、瘦、正常)输出,这个用来稍后计算损失函数的

    y_=tf.placeholder(tf.float32,name="y_predict")

    现在就可以写线性回归的表达式了

    y=tf.nn.Softmax(tf.matmul(x*w)+b)

    其中tf.matmul代表两个矩阵相乘,Softmax多用于多分类问题中,用来说明一个数据在各个分类中的概率。

    因为考虑到损失最小化,这样才能使网络预测的和真实值相差最小,所以定义交叉熵损失函数:

    cross_encropy=-tf.reduce_mean(y_*tf.log(y))

    因为目的是使这个交叉熵值最小,tensorflow为我们提供了优化器。

    train_step=tf.train.AdamOptimizer(0.01).minimize(cross_encropy)

    其中0.01代表学习率,就是每次迭代的步长。

    模型已经定义好了,下面就是训练了,我这个模型训练100000次

    for i in range(100000):

        sess.run(train_step,feed_dict={x_input=训练的特征值,y_predict=训练的标签值})

    然后留出一部分数据作为测试集,验证模型正确率,得到了上图的97.98%。

    correct_prediction=tf.equal(tf.max(y,1,name="output"),tf.max(y_,1))

    请注意加粗的这一句,一会在导入CoreML中,这句话至关重要。上面这句代码就体现了网络预测的和真实值相差的多少

    TensorFlow导入.pb文件

    constant_graph = graph_util.convert_variables_to_constants(sess, sess.graph_def, ["output"]) 

    with tf.gfile.FastGFile(pb_file_path, mode='wb') as f:                    f.write(constant_graph.SerializeToString())

    这个output就是刚才我们定义的名字,相当于我们把y=w*x+b,也就是整个模型的最终形态写入了pb文件

    iOS端

    这个在我的上一篇(尽管有两个多月了)中有过介绍,就不过多介绍怎么把pb文件转换成CoreML识别的.mlmodel文件了。转换完成后,谢谢界面代码,就可以实现开头那些图片的效果了。

    谢谢。已经是午夜了,赶紧睡了。生命不息,编码不止!

    相关文章

      网友评论

          本文标题:机器学习练手小项目--根据身高/体重判断胖瘦(移植到iPhone

          本文链接:https://www.haomeiwen.com/subject/zgqtoftx.html