反爬虫策略

作者: kmbaby | 来源:发表于2016-10-27 17:30 被阅读774次

    这篇文章是对上篇的一个实现。虽然已经破解了它再去实现有点不开心。
    但作为防止学生暴力的爬页面也比较足够了。

    需求

    在请求重要接口时要多传一个不太好爬的 authkey 实现反爬虫

    authkey 实现

    1. 生产authkey, authkey是后端生产的一个随机key, 过一段时间会过期使用一次也过期。
    2. 从算法池中取2个加密算法对authkey进行加密。
    3. 把加密后的authkey, 和 对应的2个解密算法返回给前端

    前端拿到的代码如下

    ;
    ! function() {
        var map = function(arr, f) {
            if (Array.prototype.map) {
                return Array.prototype.map.call(arr, f);
            }
            var result = [];
            for (var i = 0; i < arr.length; i++) { result.push(f(arr[i])); }
            return result;
        };
        // 删除 process 对node设障碍 不影响浏览器
        delete process;
      
        //下发的加密后的authkey
        var result = [32, 50, 103, ..., 312, 632];
        var fun_arr = [f1, f2];
    
        result = map(result, function(item){
            return String.fromCharCode(item);
        }).join('')
    
        result = fun_arr[0](result);
        result = fun_arr[1](result);
    
        callback(new Function('return "' + result + '";'));
    }();
    

    前端对代码又进行了解密 然后callback

    4 . 对整个代码转为unnicode 数组。真正返回给前端的是

    // 对上面所有代码进行unicode后返回
    eval(
        function(arr, f) {
            if (typeof Array.prototype.map === "function") {
                return arr.map(f)
            }
            var res = [],
                j = 0;
            for (var i = 0, l = arr.length; i < l; i++) { res[j++] = f(arr[i], i, arr) }
            return res
        }(
            [38684, 38658, 38727, 38742, .........., 38735, 38724, 38741],
            function(item) {
                return String.fromCharCode(item - 38625)
            }).join('')
    )
    

    5、 我们还可以加上混淆代码, 环境判断等等障碍但终究无法彻底防范。


    前端能做的还是很有限,能起到限制初学者。
    真正的预防还是在后端通过访问频率, ip 等来屏蔽。

    反爬虫就是程序员的互相伤害,爬的人不要太暴力就好。

    相关文章

      网友评论

      • da崔:随机有个问题, 如果对方不断的请求key, 但是不验证, 会对存储造成大量压力。

      本文标题:反爬虫策略

      本文链接:https://www.haomeiwen.com/subject/jaksuttx.html