美文网首页Python新世界python热爱者
python实现自动控制浏览器,自动化脚本神器selenium

python实现自动控制浏览器,自动化脚本神器selenium

作者: 48e0a32026ae | 来源:发表于2018-11-16 15:37 被阅读0次

    其实了解运维方面的人员可能并不陌生,有时候测试一些东西写好脚本让其进行自动执行,那么像自动控制浏览器,控制命令台什么都是我比较喜欢收集的模块

    这里介绍的控制浏览器的模块,我们不深究,介绍点基础操作,后期结合爬虫项目和大家分享一下

    「selenium」模块正如上文所说,更多的使用在运维的方面,但是这不妨碍其中的一些功能来做一些我们需要的功能。比如我做一个百度自动查询。

    前两天突然介绍个利用爬虫项目做的有道词典的小项目,使得没有爬虫基础的朋友很不适应,其实当时就在想,何不直接控制浏览器将让其自动查询我传入的词语,也就是在这一目的下,完成了这个

    首先介绍一些我用的selenium的安装方式以及利用方法,

    1、

    我们要知道,python是没办法控制浏览器的,这中间还是需要bridge(桥)具体原因这里面涉及的知识又很多,有兴趣的可以百度。我在「阅读原文」会给大家附一个Chrome浏览器的bridge,当然你也可以“selenium python bridge”的关键字自己根据型号下载,这东西不大,下载后即可用。

    2、

    方法一:

    设置环境变量,这就是我不喜欢Windows的原因了,当然这是指的是用Anaconda的用户,要把其路径配置到环境变量的path路径中。然后把这个driver放到Anaconda的python解释器同一个文件夹中。

    方法二:

    你和我一样是pycharm的忠实用户,那么你在安装python3的时候已经默认配置环境变量了,这个我在安装python篇也已经经过了,那么只要把driver丢到python解释器文件夹就行了。

    3、

    介绍方法(这里只介绍几个常用的方法):

    get:

    通过url访问某个网站

    find_element_by_id;

    find_elements_by_xpath

    等方法可以查找元素

    page_source

    获取当前网页的html信息

    current_url

    获取当前URL

    值得注意的是find_element_by_id,需要我们去了解页面的id,拿百度来说,F12键,定位百度输入框:

    定位百度搜索框:

    代码实现:

    1from selenium import webdriver

    2import time

    3# from selenium.webdriver.chrome import webdriver

    4key = input('输入要查询的信息:')

    5driver = webdriver.Chrome()

    6

    7driver.get('https://www.baidu.com')

    8

    9driver.find_element_by_id('kw').send_keys(key)

    10

    11driver.find_element_by_id('su').click()

    12

    13time.sleep(5)

    14

    15driver.quit()

    16driver.close()

    4

    实现起来就那几秒,没想到要写这么长时间。

    相关文章

      网友评论

        本文标题:python实现自动控制浏览器,自动化脚本神器selenium

        本文链接:https://www.haomeiwen.com/subject/xvumfqtx.html