1. 什么是selenium
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏
2. driver的安装
最简单的安装方式是:解压后把bin目录下的可执行文件移动到环境变量下,比如/usr/bin 或者是/usr/local/bin下面
注意:Chromedriver和电脑上的chrome版本有对应关系,建议使用最新的Chromedriver版本并且更新chrome浏览器到最新版
selenium通过控制浏览器,所以对应的获取的数据都是elements中的内容
from selenium import webdriver
import time
# driver = webdriver.PhantomJS() # 实例化driver
# PhantomJS()无界面化操作
driver = webdriver.Chrome()
#driver.maximize_window()# 最大化窗口
driver.set_window_size(1920,1080)
driver.get("http://www.baidu.com")
# 在input标签输入内容
driver.find_element_by_id("kw").send_keys("传智播客") # 输入内容
driver.find_element_by_id("su").click() # 点击元素
# 获取页面源码
# print(driver.page_source)
# 获取当前的url地址,跳转之后的url地址
# print(driver.current_url)
# 获取cookie
print(driver.get_cookies()) # 这个结果是列表
print("*"*100)
# 如何将列表转换为字典,使用列表推导式
print({i["name"]:i["value"] for i in driver.get_cookies()})
# 页面截屏
# driver.save_screenshot("./baidu.png")
time.sleep(3)
driver.quit() # 退出浏览器
网友评论