python批量下载公众号内的视频

作者: 后浪普拉斯 | 来源:发表于2020-06-11 12:28 被阅读0次

python批量下载公众号内的视频
教你如何入手用python实现简单爬虫微信公众号并下载视频
python爬虫公众号所有信息，并批量下载公众号视频
[免费领取]著名培训机构_全栈Python视频14期全集-会员专
超级好消息！！！我们的文章课程开通配套视频啦！！！
公众号视频、音频资源下载方式!
小甲鱼零基础入门学习Python视频教程全套96集 [5.7G]
爱存图 instome 支持批量下载啦！
微信公众号文章：音频、视频、图片一键保存
【Python】多线程批量下载视频

话不多说，言归正传，直接上步骤：

1 创建新群发

image.png

我们选择自建图文

2 搜索目标公众号内的视频的标题

在文章内添加超链接

image.png

选择目标公众号

image.png

搜索选中目标公众号

image.png

搜索公共号内的文章名称

image.png

打开开发者工具

image.png

选择network，并重新搜索

image.png

获取到请求的url

image.png

打开url

image.png

查看response

我们需要重点关注画红框的部分，在我们之后的会使用到

image.png

我们根据上面的请求url变换begin，就可以变换不同的请求，获取不同的文章列表
我们首先定义headers，在请求的时候使用。

headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
    "Host": "mp.weixin.qq.com",
    "Referer": "https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin=0&count=5&fakeid=MjM5MDg5MDY5OQ==&type=9&query=%E9%87%91%E7%93%B6%E6%A2%85&token=1917041231&lang=zh_CN&f=json&ajax=1",
    "Cookie": "自己的cookie"
}

image

其中Referer是目标的url，cookie 是自己的cookie
我们第一点的python代码就是获取文章的名称、url、appmsgid、itemidx四个字段

import requests
import jsonpath
import json
headers = {
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
    "Host": "mp.weixin.qq.com",
    "Referer": "https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin=0&count=5&fakeid=MjM5MDg5MDY5OQ==&type=9&query=%E9%87%91%E7%93%B6%E6%A2%85&token=1917041231&lang=zh_CN&f=json&ajax=1",
    "Cookie": "自己的cookie"
}

def getInfo():
    for i in range(4):
        # token  random 需要要自己的   begin：参数传入
        url = "https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin="+str(i * 5)+"&count=5&fakeid=MjM5MDg5MDY5OQ==&type=9&query=%E9%87%91%E7%93%B6%E6%A2%85&token=1917041231&lang=zh_CN&f=json&ajax=1"
        response = requests.get(url, headers=headers)

        jsonRes = response.json()
        print(jsonRes)
        titleList = jsonpath.jsonpath(jsonRes, "$..title")
        urlList = jsonpath.jsonpath(jsonRes, "$..link")
        appmsgidList = jsonpath.jsonpath(jsonRes, "$..appmsgid")
        itemidxList = jsonpath.jsonpath(jsonRes, "$..itemidx")
        print(titleList)
        print(urlList)
        print(appmsgidList)
        print(itemidxList)
        
        
        # 遍历 构造可存储字符串
        for index in range(len(titleList)):
            title = titleList[index]
            url = urlList[index]
            appmsgid = appmsgidList[index]
            itemidx = itemidxList[index]

            scvStr = "%s, %s,\n" % (title, url)
            # print(scvStr)
            with open("/Users/xxxx/Downloads/info.csv", "a+", encoding="gbk", newline='') as f:
                f.write(scvStr)

我们生成了需要的下载列表：

image.png

我们取出其中的一个链接在浏览器打开

http://mp.weixin.qq.com/s?__biz=MjM5MDg5MDY5OQ==&mid=2247491878&idx=5&sn=ce2c259c71be3cdabcafdfd6af18e67e&chksm=a6bf4e8291c8c7944a92b8eed57790651f74669aba216f3f1f15e9e11d3eebbf820efe23fa7a#rd

然后继续打开开发者工具，我们找到下图的url请求：

image.png

这就是我们所要请求url，我们查看结果：其中的url就是我们要的视频的链接

image.png

假如我们打开的链接是：

http://mpvideo.qpic.cn/0b784eaacaaafiapaprt7zpfbyodahqqaaia.f10003.mp4?dis_k=9413622f256507d5375427b9fb58b16e&dis_t=1591847011

我们打开的时候是网页的形式

image.png

我们就拿着这个url下载了
我们需要分析拿到这个url的请求:

image.png

我们需要注意的是上面的四个，其中mid和idx 是对应我们在第一步中取出的appmsgid和itemidx，enterid 是进入的时间，所以我们需要知道这个vid是什么？
但是我们不知道这是什么，所以我们就需要将第一步的结果的url请求一次，取出vid，在这里使用的是正则表达式取出来的：

response1 = requests.get(url,headers=headers)
jsonRes1 = response1.text
dirRe = r'wxv_.{19}'
result1 = re.search(dirRe,jsonRes1)
wxv = result1.group(0)
print("wxv ", wxv)

接下来我们就可以拼接视频地址了,请求结果并下载：


def getVideo(video_title, wxv, appmsgid, itemindex):
    video_path = '/Users/xxxx/Downloads/videoFiles/' + str(itemindex) + ".mp4"
    t = time.time()
    # 页面可下载形式
    video_url_temp = "https://mp.weixin.qq.com/mp/videoplayer?action=get_mp_video_play_url&preview=0&__biz=MjM5MDg5MDY5OQ==&mid="+str(appmsgid)+"&idx="+str(itemindex)+"&vid="+wxv+"&uin=&key=&pass_ticket=&wxtoken=777&devicetype=&enterid="+str(int(t))+"&appmsg_token=&x5=0&f=json"
    print("video_url_temp ", video_url_temp)
    response = requests.get(video_url_temp, headers=headers)
    content = response.content.decode()
    content = json.loads(content)
    url_info = content.get("url_info")
    video_url2 = url_info[0].get("url")
    print(video_url2)

    # 请求要下载的url地址
    video = requests.get(video_url2)
    # content返回的是bytes型也就是二进制的数据。
    video = video.content
    with open(video_path, 'wb') as f:
        f.write(video)
        f.flush()

我们最终可以下载成功：

image.png

网友评论

本文标题：python批量下载公众号内的视频

本文链接：https://www.haomeiwen.com/subject/moovtktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python批量下载公众号内的视频

1 创建新群发

2 搜索目标公众号内的视频的标题

在文章内添加超链接

选择目标公众号

搜索选中目标公众号

搜索公共号内的文章名称

打开开发者工具

选择network，并重新搜索

获取到请求的url

打开url

查看response

相关文章