爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技

作者: 小怪聊职场 | 来源:发表于2017-10-12 19:18 被阅读2816次

爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技
微信公众号及服务号文章爬取
Python爬虫爬取微信公众号历史文章全部链接
微信公众号批量爬取Java版
2019-02-21
微信公众号文章爬虫
使用python获取国自然基金列表，预测一下大佬们将要发啥文章
lxml 提取遇到的问题
Python 简单关键字爬取公众号文章
使用python爬取微信公众号文章

前一篇文章我利用Anyproxy爬取微信公众号文章及临时链接转永久链接，这个方法可以获取到文章的点赞数，阅读数之类的信息。如果你的需求只是需要获取某个微信公众号的所有文章，并且文章的链接是永久链接，那么看看我这篇文章上介绍的方法吧。

一、先说破解之道

破解的关键就是利用微信公众号后台素材管理－新建图文素材－超链接－查找文章（公众号）的接口。如下图：

进入微信公众号后台－素材管理－新建图文素材－新建图文消息

超链接－查找文章（公众号）

二、具体破解方法

2.1 通过selenium＋webdriver获取公众号的Cookie

因为在公众号后台请求“查找文章（公众号）”接口时需要一个微信公众号的Cookie，所以在爬文章内容之前需要先获取一个可用的Cookie。这块相对来说比较简单，我就直接贴上我写的代码。PS：尽情优化完善吧。

获取Cookie

2.2 通过微信公众号获取公众号文章接口获取文章

1）微信公众号登陆地址：https://mp.weixin.qq.com/

2）登录之后获取token。

3）利用微信公众号后台新建图文消息，搜索公众号名称，需要上一步的token。

搜索公众号

并且通过接口返回的内容获取公众号的fakeid。

获取公众号的fakeid

4）选定要爬取的公众号，获取文章接口地址，需要上一步的fakeid。

5）文章列表翻页及内容获取。

文章列表第一页

翻页和内容

三、完整代码

完成代码

四、这个可是技术难点呢，点个赞呗

爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技
前一篇文章我利用Anyproxy爬取微信公众号文章及临时链接转永久链接，这个方法可以获取到文章的点赞数，阅读数之类...
微信公众号及服务号文章爬取
使用Python爬取公众号文章主要两种方法：通过爬取第三方公众号聚合网站通过微信公众平台引用文章接口通过爬取...
Python爬虫爬取微信公众号历史文章全部链接
因为朋友问我能不能找一下一个微信公众号的全部历史文章的链接，我就帮他弄了一下，通过百度和谷歌发现现在大家爬微信公众...
微信公众号批量爬取Java版
最近需要爬取微信公众号的文章信息。在网上找了找发现微信公众号爬取的难点在于公众号文章链接在pc端是打不开的，要用微...
2019-02-21
爬取微信公众号文章的经验总结爬取微信公众号的文章不少，但是现在爬取微信公众号越来越难了，微信对于这方面管控是越来...
微信公众号文章爬虫
很多的微信公众号都提供了质量比较高的文章阅读，对于自己喜欢的微信公众号，所以想做个微信公众号爬虫，爬取相关公众号的...
使用python获取国自然基金列表，预测一下大佬们将要发啥文章
作者：ahworld链接：python爬取国自然基金看看大佬们将要发啥文章来源：微信公众号-seqyuan著作权归...
lxml 提取遇到的问题
了解更多的爬虫关注微信公众号“木下学Python”吧~ 爬取结构抓大标签以后，url_info.xpath('。...
Python 简单关键字爬取公众号文章
序原文地址：Python 简单关键字爬取公众号文章爬取目标：微信公众号“纵梦广科”中“表白墙”（可选“吐槽墙”）...
使用python爬取微信公众号文章
爬取前准备：开发环境：Pycharm pycharm官网，（Community）社区版是免费的，（Profess...

网友评论

啃饼小白:倒不如利用号内搜进行爬取呢

小法19:@小怪聊职场，有个问题请教下，在服务器端爬取公众号文章如何获取有效cookie？谢谢

781289028952:selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"./*//input[@id='1921286587@qq.com']"}

781289028952:抓取某个公众号数据，目前还有哪些有效方法。可否提供一下

小怪聊职场:@校哥这篇文章说的在微信公众号就可以

781289028952:@小怪聊职场主要抓取某个号全部文章做分析啦，搜狗只能抓10条

小怪聊职场:@校哥搜狗、新榜

啃饼小白:倒不如利用号内搜进行爬取呢
小法19:@小怪聊职场，有个问题请教下，在服务器端爬取公众号文章如何获取有效cookie？谢谢
781289028952:selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"./*//input[@id='1921286587@qq.com']"}
781289028952:抓取某个公众号数据，目前还有哪些有效方法。可否提供一下
小怪聊职场:@校哥这篇文章说的在微信公众号就可以
781289028952:@小怪聊职场主要抓取某个号全部文章做分析啦，搜狗只能抓10条
小怪聊职场:@校哥搜狗、新榜

爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技

相关文章

爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技

微信公众号及服务号文章爬取

Python爬虫爬取微信公众号历史文章全部链接

微信公众号批量爬取Java版

2019-02-21

微信公众号文章爬虫

使用python获取国自然基金列表，预测一下大佬们将要发啥文章

lxml 提取遇到的问题

Python 简单关键字爬取公众号文章

使用python爬取微信公众号文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

python机器学习爬虫

互联网科技

scrapy

一起学起来

python爬虫

【收集】Python网络爬虫