selenium
相当于一个机器人,可以模拟人类在浏览器上的一些行为,自动处理浏览器上的一些行为,比如点击,填充数据,删除cookies等。chromedriver
是一个驱动Google Chrome浏览器的驱动程序,使用它才可以驱动浏览器。当然针对不同的浏览器有不同的driver,包括无界面浏览器PhantomJS
。以下列出了不同浏览器及其对应的driver:
- PhantomJS : http://phantomjs.org/download.html
- Chromedriver:http://chromedriver.storage.googleapis.com/index.html
- Firefox:https://github.com/mozilla/geckodriver/releases
1 安装
- selenium包 的安装:
pip install selenium
- driver的安装:解压后把exe可执行文件移动到环境变量下
2 快速入门
2.1 加载网页
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.baidu.com/")
driver.save_screenshot("baidu.png")
2.2 定位和操作
driver.find_element_by_id('kw').send_keys('selenium自动化')
driver.find_element_by_id('su').click()
2.3 请求信息
driver.page_source
driver.get_cookies()
driver.current_url
2.4 退出
driver.quit()
3 selenium基本操作
- selenium的导包:
from selenium import webdriver
- selenium创建driver对象:
webdriver.PhantomJS()
- selenium请求数据:
driver.get(url)
- selenium查看数据:
driver.page_source
- 根据id定位元素:
driver.find_element_by_id("kw")
- 给输入框赋值:
send_keys()
- 操作点击事件:
click()
- 关闭当前页面:
driver.close()
- 关闭浏览器:
driver.quit()
网友评论