抓包获取微信文章阅读数实战

作者: SpiderV | 来源:发表于2018-07-20 17:49 被阅读237次

抓包获取微信文章阅读数实战
微信公众号爬虫
微信跳一跳任意刷分
爬虫｜使用python爬取微信公众号全部的文章（永久链接）——技
WeChat jump-a-jump
关于手游媒体你必须知道干货（下）
常用的URL Scheme
用Python数据分析来薅一下微信公众号
Nodejs 微信小程序跳一跳抓包改分作弊教程
深入springboot的实战实践文档（PDF）

8月3日更新

对于爬虫需求量较少的朋友或者本身对爬虫技术不是很熟悉的朋友可以私信我一下我这里提供免费的爬虫API (API包含三个功能 1.获取公众号最近10条历史消息 , 2.获取文章阅读数/点赞数 3.获取搜狗永久链接)

更新于2018年7月20日目前有效

--------------------------------------------------------------------------------------------------

关于搜狗转永久链接 & 抓历史消息相关文章近期会上线

有相关技术问题及批量化问题请私信联系我

之前写过几篇文章貌似最近微信又改过一次验证规则导致之前的不能用了

正文如下

首先需要获得一篇文章的地址

例如 https://mp.weixin.qq.com/s/S_g27h2KJPSb1NZ9DPM5Ig

我们在手机中访问可以看到他的阅读数和点赞数如下图

手机获取微信阅读数

如果在电脑浏览器中访问是没有阅读数的并且换了手机/微信的 user-agent 仍然不能获取到阅读数

为了解决这个问题首先我们配置好抓包工具看一下手机中访问这个页面的时候究竟有哪些参数

首先配置好类似 fiddler/charles之类的http/https抓包工具如果不会配置自行百度(不要忘记安装https证书如果是ios10之后的设备需要在设置中另外开启一个选项切记!!!!!!!)

配置好抓包工具后首先我们访问以下文章链接看一下请求

点击文章后的请求

如上图所示出现了很多很多的请求第一个是文章的html连接后面一次的还有阅读数接口和评论信息接口还有一个是公众号信息还有几个不知道是做什么的接口

所以抓包后可以得出结论 阅读数是异步获取的 那就好办了接下来我们继续看这个接口的参数就好了

https://mp.weixin.qq.com/mp/getappmsgext?f=json&mock=&uin=777&key=777&pass_ticket=QubwCfCA8tQmOKNy05WGE%25252FGdIeQ9xd5smXQdTUznrqfThf6SKZegV%25252BUoNtOHKXYT&wxtoken=777&devicetype=iOS12.0&clientversion=16070025&appmsg_token=966_UjA%252BvpGPcW4k3kPBneqR26gjfiQUlbb0tX_RWCeVBf7_ooOlyQYl1MfANvkqhiXnIy3JX4xFAhbfxM9j&x5=0&f=json

先来看一下这个链接 post传送的方式(我记得之前版本有一个 post参数参数名为 is_read 值为 1 )

先拿到postman里访问一下尝试

尝试发送请求

结果如上图所示竟然返回的是错误

继续看一下阅读数接口发现除了 get的参数和post的参数之外还有cookie没做处理

阅读数接口携带的cookie(部分)

那么这个cookie究竟是从哪里来的呢???

于是再往前翻一下第一个接口及文章的接口

这个接口中发现了 set-cookie

文章接口中的set-cookie(部分)

通过上图可以看出微信的操作是访问了文章接口会set-cookie 给你带这个cookie访问阅读数接口才可以获得阅读数

那接下来我们手动处理一下cookie 再试试

最终成功请求后的结果如下图

阅读数接口

read_num 为阅读数 like_num为点赞数

另外经过我一番整理之后我发现 cookie生成的方式依赖于文章接口中的 X-WECHAT-UIN 和 X-WECHAT-KEY这两个参数这两个参数的的来源只能是点击文章获取获取后来置换cookie 从而进行接下来的请求

这两个参数是微信那边生成的目前不知道算法而且存在过期时间

另外一个阅读数的关键参数是 appmsg_token

这个参数可以在文章页面的html中获取用正则匹配一下即可

另外还有一点小发现就是一篇文章的 X-WECHAT-UIN 和 X-WECHAT-KEY 可以获取相同公众号下的文章的阅读数

网友评论

fe522989abc7:楼主，有没有api提供，收费的也行
SpiderV:私聊我留下联系方式我给你api
SpiderV:你可以私聊我一下
icetong_k:你怎么实现批量api接口的，cookies时效最多大半天，要是拿cookies去获取阅读点赞等数量失效更快，难道每次失效cookies重新手机点一下，fiddler抓一下吗。
SpiderV:其实归根结底就是有许多的微信号这个是根本你有在高的手段每个微信号的cookie 也只能抓当日上限的次数
SpiderV:恩 uin和key 只有大约100分钟多一点的有效时间你说的如果采集多时效快的原因是到达每日上限了上限后cookies是无效理论上来说你说的 fiddler抓确实是一种方式（打出请求中的header）但不一定借助fiddler抓例如对windows / mac 客户端的微信做一些逆向在通过一些手段获取

一起学起来

本文标题：抓包获取微信文章阅读数实战

本文链接：https://www.haomeiwen.com/subject/jpyqmftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

抓包获取微信文章阅读数实战

相关文章