参考文章:https://github.com/activitynet/ActivityNet/tree/master/Crawler
训练集:9649
验证集:4728
测试集:4851
-
准备工作
需要安装anaconda,并创建py36虚拟环境,进入py36虚拟环境,执行以下三条命令安装相应的包:
pip install youtube-dl
sudo apt install ffmpeg
pip install pafy
1.首先利用如下命令,将该github项目下载下来。
gs@gs:~$ git clone https://github.com/activitynet/ActivityNet.git
2.利用cd命令进入到该工程Crawler文件夹下
gs@gs:~$ cd github项目/ActivityNet/Crawler/
gs@gs:~/github项目/ActivityNet/Crawler$
3.利用下面命令进入py36虚拟环境
gs@gs:~/github项目/ActivityNet/Crawler$ source activate py36
(py36) gs@gs:~/github项目/ActivityNet/Crawler$
4.利用下面命令创建一个存放将要下载的数据集的文件夹,我就创建在了Crawler文件夹下
(py36) gs@gs:~/github项目/ActivityNet/Crawler$ mkdir dataset
5.在ActivityNet官网上下载json文件:http://activity-net.org/download.html
将其放在Crawler文件夹下:
6.执行以下命令,赋予该文件权限
(py36) gs@gs:~/github项目/ActivityNet/Crawler$ chmod +x fetch_activitynet_videos.sh
7.执行以下命令,开始下载
(py36) gs@gs:~/github项目/ActivityNet/Crawler$ ./fetch_activitynet_videos.sh dataset activity_net.v1-3.min.json
其中dataset是下载的视频所在的路径。 如果你已经下载了一部分视频,输入该目录,则可继续下载。
网友评论