python计算机视觉深度学习4图像分类数据集(机器学习常用数据

作者: oychw | 来源:发表于2018-07-12 16:43 被阅读43次

    MNIST

    图片.png

    此数据集是正确分类手写数字,0-9。

    MNIST(NIST:National Institute of Standards and Technology,M为modified), 数据经过预处理,以减轻计算机视觉的处理负担,该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.

    此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集描述为"the drosophila of machine learning"。

    MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim,对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数,落在[0,255]范围内。

    下载
    wiki参考

    Animals:狗,猫和熊猫

    image.png

    每种动物1000张,共有3000张图片。可以在我们的CPU或GPU上快速训练深度学习模型并获得合理的准确性。

    CIFAR-10

    image.png

    CIFAR-10由60,000 32323 (RGB)图像组成。
    CIFAR-10由10类组成,包括:飞机,汽车,鸟,猫,鹿,狗,青蛙,马,船和卡车。

    虽然很容易训练在MNIST上获得> 97%分类精度的模型,但在CIFAR-10(以及更大集CIFAR-100)很难获得这样的模型。

    挑战来自于物体出现方式的巨大差异。

    参考: https://www.cs.toronto.edu/~kriz/cifar.html

    SMILES

    image.png

    SMILES数据集由面部图像组成,这些图像要么是微笑的,要么是不笑的,数据集中有13,165个灰度图像,每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部周围,允许我们设计机器学习算法专注于微笑识别。

    Kaggle:Dogs vs. Cats

    Dogs vs. Cats挑战是Kaggle比赛的一部分,旨在设计学习算法正确地将图像分类为包含狗或猫。共提供了25,000张图片
    使用不同的图像分辨率。

    image.png

    参考:https://www.kaggle.com/c/dogs-vs-cats/data

    Flowers-17

    image.png

    Flowers-17数据集是17类别的数据集,每个类别有80个图像,由Nilsback等人策划。

    Flowers-17为具有挑战性的数据集,因为规模大,视角,背景负责,变化的光照条件和类内变化。

    参考:http://www.robots.ox.ac.uk/~vgg/data/flowers/17/

    Flowers-17

    相关文章

      网友评论

        本文标题:python计算机视觉深度学习4图像分类数据集(机器学习常用数据

        本文链接:https://www.haomeiwen.com/subject/ctcrpftx.html