美文网首页我的Python自学之路数据科学家生活不易 我用python
机器学习-kNN实现简单的手写数字识别系统

机器学习-kNN实现简单的手写数字识别系统

作者: 姜康 | 来源:发表于2017-04-16 22:19 被阅读1065次

    不积跬步,无以至千里

    功能


    利用k-邻近算法,实现识别数字0到9

    开发环境


    数据集和项目源代码


    Github:https://github.com/jiangkang/KMachineLearning.git

    数据集


    下面是32*32的黑白图像

    32* 32像素数据集

    为了方便处理,提供了文本文件

    文本数据

    数据集分为训练集和测试集,其中训练集是已经分类好的数据,测试集是用来测试算法。

    将数据转换为特征向量


    从上图可知,拿到的是32*32的的矩阵,每一个点是一个像素值,将这1024(32
    ✖️32)个数值,转换成(1,1024)的向量。

    数据转换为特征向量

    KNN分类器


    参考这篇文章机器学习-从kNN开始

    kNN分类器

    输入测试集,测试算法


    测试算法

    看看选择不同的k值,分类效果如何


    取不同的k值

    这里看错误的个数,绘制一个折线图
    注意:执行时间比较长,去喝杯咖啡吧

    这里取1-4,当然你也可以取更高的k值(速度慢)

    实验结果证明,取k=3,效果比较好。

    txt转换为png图像


    为了更具真实性,同样写了txt转换为png的代码。

    txt转png

    图像转txt文件


    image.png

    总结


    数据集如果稍大一点,执行时间会变得非常长

    超光速

    相关文章

      网友评论

      • Ryan_d696:请问怎么将图片转换为32*32的二进制文本文档呢?
        7dfd360d39db:@姜康 帅哥,有没有代码实现,我尝试了你描述的方法,但总是有问题
        7dfd360d39db:@Ryan_d696 我也有同样的疑惑,亲最后解决了么
        姜康:@Ryan_d696 用pillow,先剪裁大小,然后二值化,最后把像素值依次写到文件就行了
      • wotacid:有专门交换机器学习文件的吧?我需要你的机器学习文件
        wotacid:我使用的是斯洛文尼亚大学开发的机器学习软件,叫橘子能使用这个软件平台机器学习文件的吗
        姜康: @wotacid 代码,文件都在文中写的github里

      本文标题:机器学习-kNN实现简单的手写数字识别系统

      本文链接:https://www.haomeiwen.com/subject/pjczattx.html