分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

作者: 1a076099f916 | 来源:发表于2019-01-26 15:58 被阅读9次

淘宝密码加密方式分析，及python实现
分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级
分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！
利用selenium cookies实现淘宝免密登录
网站反爬虫
爬虫基础系列urllib——构造请求头（3）
自学Python爬虫：常见的反爬与反爬处理
Python爬虫-豆瓣电影2020最新版
一个刷简书访问量的小程序（仅供学习，切勿他用）---Python
爬虫不尽兴？那再来点反爬虫吧！

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

分析了好几个小时淘宝的登陆，对其反爬虫方案有了点思路，先记录一下，后面会持续进行分析。

当然想要玩更高级的Python爬虫首先你要把基础打牢，这里小编准备了一份Python爬虫入门资料，进群：700341555即可免费领取！

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

众所周知目前使用selenium打开浏览器访问淘宝，不管你是手动还是自动登录一律都是验证不通过，之前一直没有正式分析淘宝的反爬虫方案，今天花了几个小时分析了一下，也只是对其整体有个认识，在很多细节上还不清楚。

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

总体上淘宝的反爬虫思路是：基于用户身份的ua算法，来识别浏览器是正常状态还是非正常状态，我们下面来说具体的方案。

当我们在淘宝登陆页面输完用户名，还未输入密码时会发送一个post请求。

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

这个post请求中有一个关键信息ua，至于ua怎么生成目前还未分析出，他的出处在z在全局对象window[UA_Opt.LogVal]、或者window["_n"],并且每次输出都不一样。

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

浏览器window对象，他是出于一个私有属性_n,但是怎么做到每次输出的值都不一样的，这是疑问一。

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

这个在输完用户名后的post请求有什么用？这个请求决定了是否会出现滑块验证，我们看它的响应内容：

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

needcode是需要验证或者不需要验证，在webdriver打开的浏览器中这个返回值一定是True，也就是一定要验证，但是他还不是淘宝拒绝一切selenium验证的标准，继续向下。

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

继续向下，当返回needcode是True时候淘宝出现滑块验证，那我们看滑块验证的请求：

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

其中有个t参数，t参数就是ua，也就是在验证滑块是否正确的时候淘宝后台还会对ua验证一番，检验是否为正确的标识，一切selenium打开的浏览器里面'browser': {'ie': False, 'chrome': True, 'webdriver': True},当然webdriver是比较关键的参考标准，除此还有几十个其他异于正常浏览器的属性，很明显这些信息被加密在ua参数之中。

淘宝后台在收到滑块验证信息的时候，会同时对ua经行验证，所有含有webdriver=True的验证都会被返回code=300

分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

现在我们大致就清楚了淘宝对selenium的检测：通过本地的js算法生成ua，ua里面含有浏览器信息，甚至含有当前地址，当输入完账号后会把账号和ua一起post给服务器，服务器解析ua后通过智能算法识别是否是常用登陆地、常用浏览器、环境有无异常，selenium打开的浏览器是异常浏览器，一定返回滑块验证，当完成验证后会再把ua和滑动的轨迹发给后台，后台在检测ua，一旦含有异常信息就返回code=300，验证失败。

目前ua的生成还没找到，但是他有几个特点：

每次发送的ua都不一样
ua的长度会随着使用次数的增加越来越长。

目前分析到这里，在分析中ua生成没找到，倒是把密码的加密方式找到了，RSA加密。后面的分析还会继续，欢迎探讨。

相关文章

淘宝密码加密方式分析，及python实现
上回说到《分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级》、《淘宝封杀selenium的ua算法分...
分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级
分析了好几个小时淘宝的登陆，对其反爬虫方案有了点思路，先记录一下，后面会持续进行分析。众所周知目前使用selen...
分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！
分析了好几个小时淘宝的登陆，对其反爬虫方案有了点思路，先记录一下，后面会持续进行分析。当然想要玩更高级的Pyth...
利用selenium cookies实现淘宝免密登录
关键词：selenium，python，淘宝，反爬虫，cookies 一、阿里这种公司“反爬虫技术”业界一流，如下...
网站反爬虫
爬虫和反爬虫作为相生相克的死对头，无论爬虫多厉害，都是能被复杂的反爬虫机制发现，同样的，无论反爬虫机制多么缜...
爬虫基础系列urllib——构造请求头（3）
爬虫与反爬虫爬虫:自动获取网站数据的程序反爬虫：使用技术手段防止爬虫程序爬取数据反扒机制1 判断用户是否是浏...
自学Python爬虫：常见的反爬与反爬处理
有爬虫就有反爬虫的，双方都是一直在博弈升级中。常见的反爬虫措施有：字体反爬基于用户行为反爬虫基于动态页面的...
Python爬虫-豆瓣电影2020最新版
豆瓣电影反爬虫机制升级了，网上的Python爬虫教程基本上都不能用了。以前直接requests.get()就能获取...
一个刷简书访问量的小程序（仅供学习，切勿他用）---Python
爬虫经常需要伪装浏览器进行爬取数据，爬虫与反爬虫的较量无时无刻不在上演，本期介绍爬虫神器selenium库的安装及...
爬虫不尽兴？那再来点反爬虫吧！
爬虫与反爬虫，这相爱相杀的一对，在现在你会爬虫是不够的，你还得会反爬虫。为 Python 平反首先是爬虫，爬虫...

网友评论

本文标题：分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！

本文链接：https://www.haomeiwen.com/subject/rnpijqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

大数据爬虫Python AI Sql

热点阅读

大数据爬虫Python AI Sql

Python学习

关于我们|服务条款|联系我们|分析淘宝登陆对selenium爬虫的封杀方案，反爬虫机制的升级！|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！