selenium的定位操作
掌握定位元素的方法
掌握获取元素中数据的方法
find_element_by_id (返回一个元素)
find_elements_by_xpath (返回一个包含元素的列表)
find_elements_by_link_text (根据连接文本获取元素列表)
find_elements_by_partial_link_text (根据连接包含的文本获取元素列表)
find_elements_by_tag_name (根据标签名获取元素列表)
find_elements_by_class_name (根据类名获取元素列
"""
@author:Rudy
@time : 12月6日
@message:定位元素的方法 获取元素中数据的方法
"""
from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://movie.douban.com/top250")
ret1 = driver.find_elements_by_xpath("//div[@class='item']")
print(ret1)
print("*"*100)
ret2 = driver.find_element_by_xpath("//div[@class='item']")
print(ret2)
driver.quit()
"""
仅能获取到标签
find_element 和 find_elements的区别:
find_element 返回第一个元素,如果没有就报错
find_elements 返回包含元素的列表,如果没有就返回空列表
获取属性和文本的方法:
获取文本:element.text
获取属性值:element.get_attribute("href")
"""
selenium 处理cookie
通过driver.get_cookies()能够获取所有的cookie
# 把cookie转化为字典
{cookie[‘name’]: cookie[‘value’] for cookie in driver.get_cookies()}
#删除一条cookie
driver.delete_cookie("CookieName")
# 删除所有的cookie
driver.delete_all_cookies()
页面等待
如果网站采用了动态html技术,那么页面上的部分元素出现时间便不能确定,这个时候就可以设置一个等待时间,强制要求在时间内出现,否则报错
页面等待的方法 time.sleep(10)
网友评论