定位操作
以下是所有定位操作的 API :
返回一个匹配元素, 即一个 WebElement 元素
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
返回一个列表, 包含所有匹配的元素, 即一个 WebElement 列表
find_elements_by_id()
find_elements_by_name()
find_elements_by_class_name()
find_elements_by_tag_name()
find_elements_by_link_text()
find_elements_by_partial_link_text()
find_elements_by_xpath()
find_elements_by_css_selector()
使用的时候需注意下面几点 :
python selenium 提供了两种对象 :WebDriver和WebElement
这两种对象都可以使用这些 API
这些 API 一旦执行失败(即查找不到), 就会抛出异常
因此必须使用try: .. except: ...机制避免错误的行为影响程序继续进行
WebDriver调用以上 API 进行全局定位
WebElement调用以上 API 可以进行层级定位, 即查找当前元素的子元素
WebDriver 的使用
开始的时候必须要有初始化一个WebDriver实例, 即下面的browser用来对浏览器进行控制以及页面的访问
# 请求连接
req_url="http://www.haosou.com/s?ie=utf-8&shb=1&src=360sou_newhome&q=%E9%B2%9C%E8%8A%B1"
# 打开浏览器
browser=webdriver.Chrome()
# 开始请求
browser.get(req_url)
接着, 就可以使用异常 API 进行当前页面的全局查找, 比如 :
# 获取所有的广告
all_ads_li=browser.find_elements_by_css_selector('#e_idea_pp li')
WebElement 的使用
使用browser.find_element_by_xx()得到的是一个WebElement实例
使用获得的实例调用上面的 API 即可进行层级查找
使用browser.find_elements_by_xx()得到的是一个元素是WebElement实例的 list
通过对 list 的遍历, 即可对各个实例进行相应的操作
WebDriver 的一些常用操作
browser.curren_url: 获取当前加载页面的 URL
browser.close(): 关闭当前窗口, 如果当前窗口是最后一个窗口, 浏览器将关闭
browser.quit(): 关闭所有窗口并停止 ChromeDriver 的执行
browser.add_cookie(cookie_dict): 为当前会话添加 cookie
browser.get_cookie(name): 得到执行 cookie
browser.get_cookies(): 得到所有的 cookie
driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’}) driver.add_cookie({‘name’ : ‘foo’, ‘value’ : ‘bar’, ‘path’ : ‘/’, ‘secure’:True})
browser.delete_all_cookies(): 删除当前会话的所有cookie
browser.delete_cookie(name): 删除指定 cookie
browser.back(): 相当于浏览器的后退历史记录
browser.forward(): 相当于浏览器的前进历史记录
browser.execute_script(script, *args): 同步执行 js 脚本
browser.execute_async_script(script, *args): 异步执行 js 脚本
browser.get(url): 在当前窗口加载 url
browser.refresh(): 刷新当前页面
browser.current_window_handle: 当前窗口的 handle, 相当于一个指针一样的东西, 用来指向当前窗口
browser.window_handles: 当前浏览器中的已经打开的所有窗口, 是一个 list
browser.switch_to_window(window_handle): 切换 window_handle 指向的窗口
browser.title: 当前页面的 title
browser.name: 当前浏览器的名字
WebElement 的一些常用操作
webEle.clear(): 清楚元素的内容, 假如这个元素是一个文本元素
webEle.click(): 点击当前元素
webEle,is_displayed(): 当前元素是否可见
webEle.is_enabled(): 当前元素是否禁止, 比如经常会禁用一些元素的点击
webEle.is_selected(): 当前元素是否选中, 文本输入框的内容
webEle.send_keys(*value): 向当前元素模拟键盘事件
webEle.submit(): 提交表单
webEle.tag_name: 当前元素的标签名
webEle.text: 当前元素的内容
webEle.get_attribute(name): 获取当前元素执行属性的值
网友评论