基于图像识别（神经网络）的微信朋友圈抓取（1）

作者: 天上宇 | 来源:发表于2017-10-14 09:24 被阅读0次

（学完深度学习之后，最开始想做的是一个朋友圈预测，但是第一步数据收集就卡住了。微信朋友圈没有什么接口开放出，只能一个个的手动粘，极其耗时，粘了几十条之后，就不爱弄了。）

（网上也有人问，但没什么有用的答案，唯一有用的是一篇讲反编译微信安卓APP的，这个思路很好，其实可以走这条路，另一个可能通的路是抓微信的包，分析传输数据什么的）

突然想到，可以换个思路，完全可以用图像识别的方式去“看”，哪个部分分别是什么，然后通过模拟器点击去抓取存储：

（图片来自本人的iphone6sp截屏）

简单的划分一下：

1.最左上角是个“完成”按钮

2.接下来是个“头像”，旁边是“昵称”

3.下面是“文本段”，可能没有，长度也不一定

4.再下面是“图片”，单张图片，会全部显示，多于2张的，会是缩小图，图片也可能没有，最多9张

5.这里还有可能是别的内容，比如网页的分享，或是小视屏

6.如果这里是从别的app分享过来的，下面还会有“来自哪个app”

7.再往下是“发布时间”

8.然后可能是“点赞”

9.再下一点可能是评论回复，这个截图里面没有，长度和数量不确定

10.最下面是回复框

基于以上分析，有些区域的位置其实是固定的，比如“完成”按钮，“头像”，“昵称”（昵称的长度可能不确定，但基本就是在那一行上）

还有一些，比如发布时间和点赞的位置基本都是在那一列上

往下是重点，内容分析：“文本段”，“图片”，“小视屏”，“网页”，每一个都有自己的规则，其实规则还挺好找的，放之后慢慢说吧。

网友评论

本文标题：基于图像识别（神经网络）的微信朋友圈抓取（1）

本文链接：https://www.haomeiwen.com/subject/tekxuxtx.html

基于图像识别（神经网络）的微信朋友圈抓取（1）