爬虫-反扒策略

作者: 光小月 | 来源:发表于2019-06-02 10:08 被阅读67次

现有的反扒策略：

0. 检测浏览器header， User-Agent
1. ip 封禁
2. 图片验证码
3. 滑块
4. JS轨迹
5. 证书加密
6. AI识别
7. 前端反调试

前端反调试

这篇文章介绍一下前端反调试，

扒某网站的前端代码，打开控制台要看Network，结果发现他们页面一打开控制台就不断的debugger，100ms一次，很影响看页面内容。

问题分析

每次在断点处停下来的时候页面都会跳到source这个tab页面，也能够看到他的debugger的代码，其实他的实现很简单，只有这一行代码

(function() {var a = new Date(); debugger; return new Date() - a > 100;}())

虽然简单，但是却很有效。
不停地打断你，页面跳到source页面，阻止你看他代码不
断的产生不可回收的对象，占据你的内存，造成内存泄漏，没过多久浏览器就会卡顿

这个问题解决起来还是蛮简单的，问题解决只需要一句话：禁止断点。
而对应的操作是在Chrome控制台的Source Tab页点击Deactivate breakpoints按钮或者按下Ctrl + f8(下图)。

PS: 若你觉得可以、还行、过得去、甚至不太差的话，可以“关注或点赞”一下，就此谢过!

本文标题：爬虫-反扒策略

本文链接：https://www.haomeiwen.com/subject/lkotxctx.html