不积跬步,无以至千里
功能
利用k-邻近算法,实现识别数字0到9
开发环境
- Mac
- Python3.5(Anaconda)
- PIL
- numpy
数据集和项目源代码
Github:https://github.com/jiangkang/KMachineLearning.git
数据集
下面是32*32的黑白图像
32* 32像素数据集为了方便处理,提供了文本文件
文本数据数据集分为训练集和测试集,其中训练集是已经分类好的数据,测试集是用来测试算法。
将数据转换为特征向量
从上图可知,拿到的是32*32的的矩阵,每一个点是一个像素值,将这1024(32
✖️32)个数值,转换成(1,1024)的向量。
KNN分类器
参考这篇文章机器学习-从kNN开始
kNN分类器输入测试集,测试算法
测试算法
看看选择不同的k值,分类效果如何
取不同的k值
这里看错误的个数,绘制一个折线图
注意:执行时间比较长,去喝杯咖啡吧
实验结果证明,取k=3,效果比较好。
txt转换为png图像
为了更具真实性,同样写了txt转换为png的代码。
txt转png图像转txt文件
image.png
总结
数据集如果稍大一点,执行时间会变得非常长
超光速
网友评论