Python破解GeeTest滑块验证码online

作者: 爱柚子的陈同学 | 来源:发表于2017-12-30 21:20 被阅读350次

online模式的破解

继续以国家企业信用信息公示系统为例。
补充一个完成度80%的项目和文档。代码实现主要参考 https://zhuanlan.zhihu.com/windev 的相关分析文章。
已实现以下功能:

1. 所有HTTP Request & Response协议

使用requests库实现。

2. 验证码图片的拼图重组和识别

使用Pillow库,实现滑块拼图位置的精确定位。
全局变量IMAGE_DEBUG,实现不同精准度的图片本地临时文件存储,以便观察定位效果和改进。

3. GeeTest Javascript 加解密算法破解

使用PyExecJS库,执行GeeTest Javascript方法,获得正确的明文和密文。
配合NodeJS使用更佳。

4. 使用BeautifulSoup4库,进行网页数据解析

未完成的20%包括2部分。

  • 完善用户鼠标轨迹运行的数据仿真算法。
  • 补全官网针对爬虫返回HTTP 521的处理,补全Cookie校验逻辑。

源码见GitHub

https://github.com/9468305/python-script/tree/master/geetest_online

Dependence

pip install requests
pip install Pillow
pip install PyExecJS
pip install beautifulsoup4

相关文章

网友评论

  • 52597a0f60a1:大佬,521了.....近期有打算继续完善嘛~
    52597a0f60a1:@爱柚子的陈同学 我自己解决滑动验证码的问题了,问题是这网站还有顺序点击的验证码,楼主有没有好的思路?
    52597a0f60a1:@爱柚子的陈同学 我也想啊,水平太一般了,怕写完又都换了机制了....
    爱柚子的陈同学:@lugof 我个人暂时没这个需求场景。要不你帮我完善一下?

本文标题:Python破解GeeTest滑块验证码online

本文链接:https://www.haomeiwen.com/subject/scvngxtx.html