美文网首页爬虫技术分享
突破58防采集策略解析-保护伞下的灰色地带

突破58防采集策略解析-保护伞下的灰色地带

作者: gbkhero | 来源:发表于2018-03-19 08:19 被阅读31次

    随着国家2017年6月1日,颁布了新的“网络安全法”,网络安全法第四十四条规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。其中最强调的就是“公民个人隐私”,因此守护公民隐私信息成为各大平台的首要目标。

    其中58是其中之一,针对个人隐私信息的保护,在这种综合信息发布平台是无可厚非的。今天咱们来解析下如何一步一步突破58新的防采集策略,仅供学习用途,用于非法途径与作者无关。

    首先咱们在浏览器打开58,引入眼帘的是满屏的各种服务项目,不愧是“神奇的网站”,咱们进入正题,不管哪个分类下的信息都是由商家或者个人发布的,他们的目的各一,但都会留下他们的联系方式,这样看到信息的人才能找到他们。

    58“神奇网站”

    咱们先随便找个分类,“二手手机”里的一条发布信息,从图中可以看出,58基于个人隐私做了保护处理,以转接号码400-***的号码做了转接,这样采集者就没办法很方便的获取这些信息,是对发布者隐私的一种保护,针对这种保护措施,基本是很难去采集的,但世上没有绝对的事情,这里不做详解。

    受保护的发布者信息

    咱们在看看“招聘”分类,随便找一条招聘信息,从图中可以看出,有些信息是需要投简历才可以看到的,

    网页端需申请

    看来咱们直接走网页端是走不通的,防采集重点就在网页端,咱们试着进入APP,查看是否可以看到。按照正常路径登录,申请职位后,可以查看到联系方式。

    可以正常呼叫 获取到拨号号码

    既然通过APP走正常途径,是可以联系发布者的,那如果不按常理出牌会不会也是可行的呢,咱们尝试抓包瞧瞧。。。

    抓包成功

    果然,分析后发现这个是可以抓包成功的,因鉴于保护发布者隐私,这里做马赛克处理,再次强调此方法只供学习使用,不可用于非法用途。

    喜欢爬虫数据采集的可联系Q540111029,咱们一起探讨交流学习。

    相关文章

      网友评论

        本文标题:突破58防采集策略解析-保护伞下的灰色地带

        本文链接:https://www.haomeiwen.com/subject/rxvyqftx.html