美文网首页
python爬取小视频,看完身体一天不如一天!

python爬取小视频,看完身体一天不如一天!

作者: Java丶python攻城狮 | 来源:发表于2019-04-17 22:29 被阅读0次

    Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以在这里给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,都放在了文章结尾,欢迎前来领取!

    python爬取小视频记录

    学习python简单爬虫小程序,记录代码和学习过程

    环境信息

    python 2.7.12

    分析与步骤

    1. 要分析网站信息 http://www.budejie.com/video/

    2. 查看网页不同页面的信息

    http://www.budejie.com/video/2

    http://www.budejie.com/video/3

    http://www.budejie.com/video/4

    可以知道,不同页面的URL规则,直接在后面输入数字查看跳转到不同页

    3. 分析视频内容特点

    如图:

    查看网页代码:

    通过这段代码,我们可以考虑分析。在python代码中用一段存放描述内容,一段存放视频所在的url

    对于每个url地址,通过urllib所提供的urlretrieve下载

    4. 具体代码实现

    # -*- encoding:utf8 -*-importreimportsysimporturllib2importurllibimportosreload(sys)sys.setdefaultencoding("utf-8")#a = 1url_name = []defget(pageindex):url ='http://www.budejie.com/video/'+ str(pageindex)# var1.set('已经获取到第%s页的视频视频'%(a))printurl html = urllib.urlopen(url).read() url_reg =r'data-mp4="(.*?)"'url_items = re.findall(url_reg, html) name_reg = re.compile('<div class="j-r-list-c-desc".*?<a href=".*?>(.*?)</a>.*?</div>', re.S) name_items = re.findall(name_reg, html)fori, kinzip(name_items, url_items): url_name.append([i, k])#传入文件名和video地址defsaveVideo(filename,videoUrl):print'Saving : %s ...'%filename urllib.urlretrieve(videoUrl,'D:\\video\\%s.mp4'%filename)####main exec ####forpageindexinrange(1,3): get(pageindex)forindex,iteminenumerate(url_name): saveVideo(index,item[1])

    文末福利

    获取方式:加python群 839383765 即可获取!

    相关文章

      网友评论

          本文标题:python爬取小视频,看完身体一天不如一天!

          本文链接:https://www.haomeiwen.com/subject/bmzowqtx.html