Python爬虫之b站视频的爬取

Python爬虫之b站视频的爬取

作者: dc260c55dcc9 | 来源:发表于2019-05-20 09:25 被阅读3次

【Python数据分析案例】python数据分析老番茄B站数据
python爬取下载b站视频
Python爬虫之b站视频的爬取
Python爬虫实战之爬取链家广州房价_03存储
堪称史上最强的代码采集B站全部视频！python 帮你
python-爬虫学习（文字、图片、视频）
python爬虫学习（文字、图片、视频）
一个不那么典型的Python爬虫
用requests爬取B站视频封面
python爬虫之爬取教务网成绩

我用 Python 对 b 站的小视频进行了爬取，因为是小视频，大小平均在 5 兆以内。排队时，没网络也能看小姐姐了，爽啊。文末给出了源码获取方式。

b 站小视频地址：

http://vc.bilibili.com/p/eden/rank#/?tab=全部

、

我爬取了每日的小视频排行榜，学会了每日的，爬取本周、本月的就非常简单了，改个标签就行，稍后详细分析会讲到。以下是爬取结果。

项目环境

语言：Python3

工具：Pycharm

程序结构

主要由 3 部分组成：

get_json()：提取目标网页的 json 数据信息。

downloader()：下载小视频并显示下载进度。

主函数：循环下载视频直到下载完毕。

代码分析

打开网站往下滑动，视频是动态加载的，打开调试工具，向下滑动加载视频，查看 Headers 中 url ，url 中前面部分的链接是不变的，提取出来。（左右滑动查看全部代码）

http://api.vc.bilibili.com/board/v1/ranking/top?

观察下方参数的变化，发现只有 next_offset 这个字段在变，每次都比前一个多 10。

这就好办了，我们把参数部分单独拿出来，把可变的 next_offset 写成变量，返回目标网页的 json 数据。

接下来，我把小视频下载下来，为了美观，我做了个下载器，显示下载速度。效果如下。

此处有个地方需注意下，请求目标网页时必须带上此网页的 headers 信息，网站做了反爬操作，否则下载下来的视频是空的，部分代码如下。（ps：大家运行代码时把 headers 换成自己浏览器在本网页的 headers 即可）

主函数中为了提取更多视频，我们把 next_offset 这个变量做个循坏，然后从 json 数据中提取视频的标题和可下载的链接。观察下页面的 json 数据结构就可以轻松获取文章标题和下载链接数据。

为了防止有些视频没有提供下载链接的情况，我加了异常处理，细心的朋友应该发现了文章前面给的效果图只有84个视频，原因就在此。最后，为了防止 ip 被封，设置了随机等待时间。其实，总体下来，不到 5 分钟，100 个视频可以全部下载完毕。

今日排行榜的 100 个小视频搞定了，每周、每月的就简单了，get_json() 方法中参数 params 有个标签字段 tag，每日的是「今日热门」，每周的改成「每周热门」，每月的改成「每月热门」就搞定了。

学习python爬虫过程中有不懂的可以加入我的python零基础系统学习交流秋秋qun：前面是934，中间109，后面是170，与你分享Python企业当下人才需求及怎么从零基础学习Python，和学习什么内容。相关学习视频资料、开发工具都有分享

相关文章

【Python数据分析案例】python数据分析老番茄B站数据
一、爬取老番茄B站数据前几天开发了一个python爬虫脚本，成功爬取了B站李子柒的视频数据，共142个视频，17...
python爬取下载b站视频
python爬虫系列：上一篇python爬取图虫网图库今天突然来了兴趣想要爬取下载b站视频，话不多说，说干就干。 ...
Python爬虫之b站视频的爬取
我用 Python 对 b 站的小视频进行了爬取，因为是小视频，大小平均在 5 兆以内。排队时，没网络也能看小姐姐...
Python爬虫实战之爬取链家广州房价_03存储
问题引入系列目录： Python爬虫实战之爬取链家广州房价_01简单的单页爬虫 Python爬虫实战之爬取链家广...
堪称史上最强的代码采集B站全部视频！python 帮你
小编有发过b站爬取图片的视频，关注小编可以找到小编发的b站爬取图片的视频哦！跟爬取b站视频代码是差不多的哦！
python-爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取
python爬虫学习（文字、图片、视频）
爬虫-文字爬取爬虫-图片爬取爬虫-视频爬取
一个不那么典型的Python爬虫
PYTHON爬虫入门&视频网站BILIBILI用户爬取爬虫详解前言 Python使用版本：2.7 得到数据挖掘的...
用requests爬取B站视频封面
最近看到一篇文章介绍了利用Python爬虫爬取B站视频封面的文章，虽然我完全没看文章，但是只看了一眼这个封面图就彻...
python爬虫之爬取教务网成绩
python爬虫之爬取教务网成绩这次的内容主要就是讲述自己的第一只python爬虫，而所要爬取的对象就是学校的教...

网友评论

本文标题：Python爬虫之b站视频的爬取

本文链接：https://www.haomeiwen.com/subject/eqdhzqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据爬虫Python AI Sql

python学习圈

热点阅读

大数据爬虫Python AI Sql

python学习圈

关于我们|服务条款|联系我们|Python爬虫之b站视频的爬取|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！