美文网首页
Python爬虫系列13-抓取快手短视频数据下载

Python爬虫系列13-抓取快手短视频数据下载

作者: Tony_Pm | 来源:发表于2022-07-01 15:51 被阅读0次

序言

读书不是唯一出路,但学习一定是。
有些人忙碌的活着,有些人努力的拼搏,有些人随意挥霍青春,人生百态,各有不同。

实战

快手的官网中有很多不同种类的栏目,如果想抓取该网站的视频数据,就需要先确定要抓取的视频种类。


image.png

比如直播数据,当然直播的数据肯定是抓取不了的,因为还没有生成mp4文件。


image.png
image.png

进入主播的直播间,我们可以看到主播发布的作品,这些作品都是可以批量抓取的。

image.png
image.png

分析网页的时候,可以通过搜索关键词mp4文件。找到之后就可以请求并下载数据了;大家可以自行摸索一下。我前面的文章都有讲如何分析。《键盘上按F12就可以进入到抓包工具界面》。


image.png

第一步:请求网页数据;这里我采用进度条形式的下载方式


from tqdm import tqdm
import time

for tony in tqdm(range(100)):
   time.sleep(0.5)
image.png

第二步:获取网页视频长度

import requests

url = 'https://txmov2.a.kwimgs.com/bs2/newWatermark/Nzc1MTI4NjU4ODE_zh_4.mp4'

# 发起网络请求  Content-Length: 5817208  长度

res = requests.get(url)
size = int(res.headers['Content-Length'])
print(size)
image.png

第三步:对视频长度进行处理及保存


file_name = 'tony老师下载的王者荣耀视频.mp4'
# bytes 字节
with open(file_name,'wb') as file:
    # 100%|██████████| 100/100 [01:40<00:00,  1.01s/it]   kb
    for tony in tqdm(
        # 视频文件读取
        res.iter_content(size),
        total=size,
        desc=file_name,
        unit='kb'
# tony老师下载的王者荣耀视频.mp4: 27460kb [00:00, 372074.26kb/s]

    ):
        #  15%|█▍        | 14/100 [00:14<01:26,  1.01s/it]
        file.write(tony)

image.png

结果展示

image.png

在这个浮躁的时代;竟然还有人能坚持篇篇原创;

如果本文对你学习有所帮助-可以点赞👍+ 关注!将持续更新更多新的文章。

支持原创。感谢!

相关文章

网友评论

      本文标题:Python爬虫系列13-抓取快手短视频数据下载

      本文链接:https://www.haomeiwen.com/subject/ogmivrtx.html