Selenium模拟登录系列 | 淘宝滑块验证码破解!不难嘛!
爬遍天下无敌手 2020-06-29 15:09:52 !
导语
好久没更新了,上来冒个泡吧。各位小伙伴还记得前段时间号主挖过的一个坑嘛(虽然我曾经挖过无数个坑T_T):
Selenium模拟登录系列 | B站滑块验证码破解
今天随手更新了一下SeleniumLogin这个包,支持了一波利用selenium模拟登录淘宝,顺便分享给大家。虽然不想承认,但是这篇文章其实挺水的,因为我没想到淘宝的滑块验证码这么容易就能过T_T。
废话不多说,让我们愉快地开始吧~
相关
文件
本系列所有相关代码都可以在这找到:
https://github.com/CharlesPikachu/SeleniumLogin
开发工具
Python****版本:3.6.4
相关模块:
selenium模块;
以及一些python自带的模块。
Chromedriver:
在下面这个链接里下载和电脑上的谷歌浏览器版本相匹配的驱动:
http://npm.taobao.org/mirrors/chromedriver/
环境搭建
安装python并添加到环境变量,pip安装需要的相关模块即可。
原理简介
先实例化一个webdriver.Chrome对象,用于自动化操作我们电脑里的谷歌浏览器:
browser = webdriver.Chrome(executable_path=chromedriverpath, options=chrome_opts)
接着,我们用它来自动访问一下淘宝网:
browser.get('http://www.taobao.com')
并模拟点击网页左上方的"亲,请登录"以进入淘宝网的登录界面:
具体而言,代码实现如下:
button = driver_wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'h')))
自动填充一下用户名和密码:
# 输入用户名密码
上面的代码直接用ID来定位输入框了:
当然你也可以通过以下这些方式来定位网页中的元素,具体想怎么用全看个人喜好,初学者不必过于纠结这些东西:
BY.CLASS_NAME
自动填充完用户名和密码后,登录界面可能会出现滑块验证码,如下图所示:
[图片上传失败...(image-4a2b29-1602879077329)]
这类滑块验证码需要用户按住滑块,并将它拖动到最右边。一开始我以为淘宝会加入一些检测手段以识别是机器还是人在操作滑块。结果我发现我想多了,用ActionChains函数直接把滑块一口气拖到最右边就能验证通过了:
try:
最后模拟点击一下登录按钮就ok啦:
# 点击登录按钮
大功告成,完整源代码详见相关文件呗~
效果展示
想要学习实现原理的,可以自己参考我上传到Github上源代码:
https://github.com/CharlesPikachu/SeleniumLogin
对于不想了解原理只想直接使用的小伙伴,我已经把本文介绍的淘宝模拟登录功能打包好上传到pypi了,库的名字叫SeleniumLogin,用法和之前开源的DecryptLogin类似:
实战
只不过DecryptLogin借助于requests实现各大网站的模拟登录操作,而SeleniumLogin借助于selenium。
具体而言,只需要pip安装:
pip install SeleniumLogin
然后写几行代码就可以实现淘宝的模拟登录啦:
from SeleniumLogin import login
简单演示自动登录淘宝的效果吧:
from SeleniumLogin import login
lg = login.Login()
name = "xxxxxxxxxxxxxxxxxxxxxxx"
password = "xxxxxxxxxxxxx321"
username, browser = lg.taobao(username=name, password=password, chromedriverpath=r"D:\software\chromedriver\chromedriver.exe")
网友评论