欢迎关注本专栏《TensorFlow & AI 学习专栏》
三个关键步骤
在上一节 《自制人工智能TensorFlow之01环境安装》中我们已经成功安装TensorFlow环境,下面我们将从0开始训练一个分类器。我们第一个分类任务就从手写识别开始吧。在AI领域有个著名的数据集MNIST,本文将使用notMNIST数据集,这个数据集还英语表前10个字母。
下面是机器学习分类器三个关键部分:
- 训练pipeline
- 神经网络建立和训练输出
- 用例pipeline
训练pipeline 包含获取数据、清洗数据、数据均匀化和转化为神经网络可以接受的格式。通常我们在训练部分要花费大概80%至85%的时间。一般来说, 训练数据越逼真, 在训练管道上花费的时间就越多。在实际环境中, 训练pipline管可能是一项持续不断的工作。随着数据集越来越大, 情况尤其如此。
神经网络建立和训练阶段,解决的问题不同花费的时间就不同。例如常规的问题通常训练时间比较短,而非常规问题通常训练难度就比较大。神经网络训练需要耗费大量的计算资源。
网友评论