美文网首页
基于图像识别(神经网络)的微信朋友圈抓取(1)

基于图像识别(神经网络)的微信朋友圈抓取(1)

作者: 天上宇 | 来源:发表于2017-10-14 09:24 被阅读0次

    (学完深度学习之后,最开始想做的是一个朋友圈预测,但是第一步数据收集就卡住了。微信朋友圈没有什么接口开放出,只能一个个的手动粘,极其耗时,粘了几十条之后,就不爱弄了。)

    (网上也有人问,但没什么有用的答案,唯一有用的是一篇讲反编译微信安卓APP的,这个思路很好,其实可以走这条路,另一个可能通的路是抓微信的包,分析传输数据什么的)

    突然想到,可以换个思路,完全可以用图像识别的方式去“看”,哪个部分分别是什么,然后通过模拟器点击去抓取存储:

    (图片来自本人的iphone6sp截屏)

    简单的划分一下:

    1.最左上角是个“完成”按钮

    2.接下来是个“头像”,旁边是“昵称”

    3.下面是“文本段”,可能没有,长度也不一定

    4.再下面是“图片”,单张图片,会全部显示,多于2张的,会是缩小图,图片也可能没有,最多9张

    5.这里还有可能是别的内容,比如网页的分享,或是小视屏

    6.如果这里是从别的app分享过来的,下面还会有“来自哪个app”

    7.再往下是“发布时间”

    8.然后可能是“点赞”

    9.再下一点可能是评论回复,这个截图里面没有,长度和数量不确定

    10.最下面是回复框

    基于以上分析,有些区域的位置其实是固定的,比如“完成”按钮,“头像”,“昵称”(昵称的长度可能不确定,但基本就是在那一行上)

    还有一些,比如发布时间和点赞的位置基本都是在那一列上

    往下是重点,内容分析:“文本段”,“图片”,“小视屏”,“网页”,每一个都有自己的规则,其实规则还挺好找的,放之后慢慢说吧。

    相关文章

      网友评论

          本文标题:基于图像识别(神经网络)的微信朋友圈抓取(1)

          本文链接:https://www.haomeiwen.com/subject/tekxuxtx.html