CIFAR10数据集手动下载和导入

作者: 廿怎么念 | 来源:发表于2020-03-10 17:25 被阅读0次

    1 简介:

    CIFAR10 数据集由加拿大Canadian Institute For Advance Research发布,该数据集包含十大类物体彩色图片,每个类收集6000张32×32大小的图片,共6万张,其中5万张为训练集,1万张为测试集。

    CIFAR10数据集

    2 下载

    可通过下列代码直接下载:

    (x,y), (x_test, y_test) = datasets.cifar10.load_data()

    该代码自动从下面的地址下载数据

    https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

    通常这样下载会比较慢,我们可以复制该链接,用迅雷等下载工具下载。下载完成后,会得到一个名为cifar-10-python.tar的压缩文件

    CIFAR10压缩文件

    把该文件拷贝到C盘users下的keras/datasets中,例如下图

    keras/datasets

    然后把cifar-10-python.tar的文件名改为cifar-10-batches-py.tar,这里要特别注意,网上有些博客上写的是改为cifar-10-batches-py.tar.gz是错误的,至少在我这里没有运行正确。改好名字之后再运行下列代码即可:

    (x,y), (x_test, y_test) = datasets.cifar10.load_data()

    事实上,如果没有手动拷贝压缩包到C盘的~/keras/datasets文件夹的话,上面的这行代码会把数据下载到该文件夹下,并将它命名为cifar-10-batches-py.tar。

    总结经验:当用datasets.xxx.load_data()数据时,如果出错或下载过慢,可以首先拷贝该行代码下的Downloading data from给出的网址,然后用迅雷等下载工具下载数据。然后,观察这行代码在C:users\xxx\kears\datasets中创建了什么文件,把该文件名拷贝下来。等数据下载完成之后,把下载的数据拷贝到这个路径,并重命名为拷贝下来的文件名即可。

    相关文章

      网友评论

        本文标题:CIFAR10数据集手动下载和导入

        本文链接:https://www.haomeiwen.com/subject/micgdhtx.html