(学完深度学习之后,最开始想做的是一个朋友圈预测,但是第一步数据收集就卡住了。微信朋友圈没有什么接口开放出,只能一个个的手动粘,极其耗时,粘了几十条之后,就不爱弄了。)
(网上也有人问,但没什么有用的答案,唯一有用的是一篇讲反编译微信安卓APP的,这个思路很好,其实可以走这条路,另一个可能通的路是抓微信的包,分析传输数据什么的)
突然想到,可以换个思路,完全可以用图像识别的方式去“看”,哪个部分分别是什么,然后通过模拟器点击去抓取存储:
(图片来自本人的iphone6sp截屏)
简单的划分一下:
1.最左上角是个“完成”按钮
2.接下来是个“头像”,旁边是“昵称”
3.下面是“文本段”,可能没有,长度也不一定
4.再下面是“图片”,单张图片,会全部显示,多于2张的,会是缩小图,图片也可能没有,最多9张
5.这里还有可能是别的内容,比如网页的分享,或是小视屏
6.如果这里是从别的app分享过来的,下面还会有“来自哪个app”
7.再往下是“发布时间”
8.然后可能是“点赞”
9.再下一点可能是评论回复,这个截图里面没有,长度和数量不确定
10.最下面是回复框
基于以上分析,有些区域的位置其实是固定的,比如“完成”按钮,“头像”,“昵称”(昵称的长度可能不确定,但基本就是在那一行上)
还有一些,比如发布时间和点赞的位置基本都是在那一列上
往下是重点,内容分析:“文本段”,“图片”,“小视屏”,“网页”,每一个都有自己的规则,其实规则还挺好找的,放之后慢慢说吧。
网友评论