两种思路,一种是利用wx.sogou.com,微信的搜狗引擎去搜索公众号的文章,其实跟爬普通网页没有什么区别,现在有反爬。
https://zhuanlan.zhihu.com/c_65943221
第二种是像下面这个一样利用fiddler做代理,得出微信查看历史消息的url,对此进行分析后,递归爬下来,并存储和分析
https://juejin.im/book/5a157c155188254a701eb3c1
明显第二种的方法更好一些,而且能够得到的内容,评论,点击量,赞等数据更多,所以即使是付费的内容也弄下来看一下。讲的真不错。准备自己弄一个练手
网友评论