前言
注意这个数据集是依托于youtube的,不是一键下载文件全都有的。
所以使用起来略有一些繁琐。不过放心,我这里已经找到了很多工具,可以方便使用。
下载数据集索引
进入 https://research.google.com/audioset/download.html
下载 Unbalanced train
这是一个csv格式
打开后会发现
形如这样
Aclv9drugo0, 50.000, 60.000, "/m/03q5_w,/m/09x0r"
从左到后是youtube视频id,音频开始时间,结束时间,最后就是label了。
label 的索引
进入这里
https://github.com/audioset/ontology
打开ontology.json文件,这里有label的编码和对应的实际意义。
例如我想要所有包含piano声音的片段
搜索Piano,得到对应 id 是 /m/05r5c
如此便可从csv文件中筛选出需要的视频id.
下载音频/视频
这段代码会帮你根据id分析出视频的下载地址,mp4,flv等格式
https://github.com/zarkiel/Youtube
最后提取对应时间的音频片段即可。
网友评论