刚开始用selenium+Python做简单的网页自动化
简单应用感觉还是好上手的
主要是要清楚操作流程 能够准确定位元素 就能把整个脚本流畅的写下来
然而实际上。。。时不时写着写着就尴尬了啊
比如说很多网页的登录都需要验证码
有些是图片验证码 还有一些奇奇怪怪的需要拖动啊或是选择
简单来说就是对真实用户来说都很简单 但是让计算机自动识别。。。就很尬了 ( ̄. ̄)
解决方案有如下几种:
1.引入图片识别(比较麻烦啦还没去尝试,而且也不是百分百准确的)
2.跟开发沟通让开发加一个万能验证码(最简单省力了哦,不过开发比较难沟通的话。。。另说)
3.用cookie跳过登录(如果不需要测试登录这一模块的话,最理想的还是直接跳过登录这一步了)
详说一下用cookie跳过登录 看起来很厉害的样子
一开始怎么也没看明白 还是后来程序员哥哥看了下
自己再回过头看 感觉也还清楚的 怪我太蠢
简单过程就是 👇
手动登录目标网站——获取网站cookie信息——将保存登录信息的cookie写入脚本——加上刷新语句
下面以简书网站为例来做一下小示范
首先打开简书
简书首页 未登录状态当前是未登录的状态
上面标出来的是Chrome的一个插件可以方便的获取到cookie
从Chrome的扩展程序中获取 需要翻墙哦
Chrome扩展程序点击就能看到网站的cookie信息
网页cookie信息
然后手动登录简书 登录之后再看cookie信息
登录之后的cookie信息
是不是有些不同
要实现跳过登录 我们并不需要记录所有的cookie
只要记录登录相关的cookie就好了
在这里需要的就是 remember_user_token
要确定哪个是我们需要的登录相关的cookie的话。。。看名字嘛
确定不了的话 就多写几个好了 ╮( ̄▽ ̄)╭
(一本不正经)
然后小demo的源码是酱紫滴
简单脚本源码恕我直言。。。有点丑是不是
没办法这信息有这么这么长
然后去运行脚本
打开网页之后 会自动刷新 刷新之后就是登录状态了
然后就可以为所欲为 为所欲为 为所欲为了 (~ ̄▽ ̄)~
脚本运行结果另外除了上面这个插件 还可以自己从网页上找cookie信息
在网页上 右键——>检查——>Application——>Cookies
不过这样看到的信息更多更杂 有点晕字。。。
Application-->Cookies-->下方的网址国庆长假 睡的有点开心 家里的床简直不要太舒服啊
然后也。。。胖了一圈?
总是吃得太多想的太少 ╮(╯_╰)╭
网友评论