美文网首页深度学习人工智能数据集
Never403:Get微软恶意软件挑战赛数据集

Never403:Get微软恶意软件挑战赛数据集

作者: 丶青霜 | 来源:发表于2018-11-14 11:02 被阅读60次

    一.前言

    在下载之余利用间隙时间来分享Microsoft Malware Classification Challenge (BIG 2015)数据集的获取。先前笔者在搜索引擎想得到获取方式的时候,几乎没有教程是特定于这个数据集的,于是想记录这个过程。

    二.准备

    1.安装kaggle库

    pip install kaggle
    

    2.注册登录kaggle账户
    https://www.kaggle.com/
    亲测用谷歌账号可以直接登录。
    如果注册一个账号,会给你注册的邮箱发送一封激活邮件,在最后一步激活的时候人机身份验证显示不出来。

    图1 翻墙之前
    这里,要用VPN翻墙才能显示,推荐共享看世界,官网有教程,这里不做赘述。
    图2 翻墙之后
    3.下载kaggle.json
    图3 打开My Account 图4 选择create NEW API Token
    4.放置kaggle.json
    将上述下载的kaggle.json放入如下路径的文件夹中:
    图5 放置路径

    三.步骤

    1.规则接受
    这是对kaggle上所有数据集而言,必须且关键的一步,否则在下载的时候会报"403-Forbidden"。
    ①点击"Rules"选项卡

    图6 Rules选项卡
    ②滑到底部"Rules acceptance"区域,点击"I Understand and Accept"
    图7 接受规则
    ③验证
    填写用于接收验证码的手机号,注意格式(+86-xxx-xxxx-xxxx),保证VPN开启,用于显示人机身份验证(否则显示不出来)
    图8 验证界面
    2.下载数据集
    在完成上述步骤后,进入CMD命令窗口,输入以下命令就可以用kaggle API下载数据集了:
    kaggle competitions download -c malware-classification
    

    这个命令在对应比赛数据集的"Data"选项卡对应的内容中,直接复制粘贴即可。


    图9 kaggle命令

    四.结果

    最终文件会下载到"C:\Users[username]"中。


    图10 下载过程

    五.小结

    以上是笔者就大家可能会遇到的问题进行的总结,希望对各位有所帮助。

    相关文章

      网友评论

        本文标题:Never403:Get微软恶意软件挑战赛数据集

        本文链接:https://www.haomeiwen.com/subject/zjddfqtx.html