美文网首页
浅尝辄止92-爬取无版权音乐

浅尝辄止92-爬取无版权音乐

作者: 阿棍儿_Leon | 来源:发表于2019-08-28 11:23 被阅读0次

    https://audionautix.com/是一个免费音乐网站,这上面的音乐都是Jason Shaw一个人创作的,可以商用,只需要满足一个条件,即标记music by audionautix.com即可。我的需求是视频制作用到的背景音乐,所以我在视频介绍中写上这一条就不会有法务问题了。

    虽然我这种小人物本来也不会有这种法务问题,但是我喜欢做事干净。

    这个网站虽好,但是找音乐却不好找。
    首先,它是国外网站,网速慢,试听起来效率很低,如果能下载下来试听就好了。
    其次,它没有提供完整的音乐列表,如果什么都不选就点搜索,不会列出来任何结果,只能手动选择一些类别,然后下载,很麻烦。
    因此,我简单研究了一下网站爬取,可以简单地解决这个问题,至少能把下来链接全部找到,然后用任何工具下载就都很方便了。
    步骤大概是这样

    1. python环境
    2. selenium环境
    3. 写python代码
      用页面上的Tempo(音乐速度)进行筛选,就只有Fast、Medium、Slow三个类别了,所以步骤大概是这样:
    • 打开页面,点击Fast/Medium/Slow其中一个
    • 点击搜索按钮
    • 获取搜索结果中的所有链接

    以下是搜索Fast类别时的写法

    from selenium import webdriver
    from time import sleep
    
    brower = webdriver.Firefox()
    brower.get('https://audionautix.com')
    sleep(2)
    elem_select = brower.find_element_by_id("fast")
    elem_select.click()
    sleep(1)
    elem = brower.find_element_by_class_name("button")
    elem.click()
    sleep(2)
    elem_dl = brower.find_elements_by_class_name('download')
    for i in elem_dl:
        print(i.get_property('href'))
    

    每个音乐都是有标签的,如果全下载下来,就可能丢失标签类别,下下来一大堆音乐,也没有变得更容易筛选。因此,还可以优化的是对标签的保留,在搜所结果中是有这些信息的,下载的时候就可以利用这些信息。

    相关文章

      网友评论

          本文标题:浅尝辄止92-爬取无版权音乐

          本文链接:https://www.haomeiwen.com/subject/jykpectx.html