瑞数通过客户端动态生成cookie的机制来进行反爬虫和安全防护,一般的爬虫都是通过伪造请求头来模拟浏览器访问,抓取服务器数据,而这种动态cookie的方式使得服务器很容易判断客户端是爬虫还是正常浏览器在访问,而且动态cookie使用了加密措施,并且加密js也是动态生成的、加密混淆的,这进一步增加了爬虫伪造的成本和代价。
这是一场爬虫与反爬的攻防战,道高一尺魔高一丈,很多爬虫无下限的抓取频率影响到了服务器的正常服务,所以逼迫厂家采取反爬措施,现在各种反爬措施都有应用,比如字体替换、隐藏真实数据,比如这家瑞数的方案等等。
文书网、商标网还有一批教育网站都使用了瑞数的不同版本的解决方案,难度增加不代表破解不了,网上就有人开源了某些版本的瑞数破解代码。
瑞数一家安全届后起之秀,凭借独有的安全防护技术拿到了上亿元的融资。
网友评论