selenium 是python总的一个库,它提供了一组工具个API,webdriver就是其中的一个工具,
Selenium WebDriver 是一个支持浏览器自动化的工具。它包括一组为不同语言提供的类库和“驱动”(drivers)可以使浏览器上的动作自动化。
在爬取网页的时候,就可以用这个库和工具来实现自动打开网页
在python上安装selenium 库
cnd 打开命令窗口:利用pip进行安装
pip selenium
然后就可以利用webdriver 打开指定的浏览器,例如谷歌

这是打开爬取网页的固定格式,叫素质四连,固定的四个步骤
from selenium import webdriver 从selenium 库中引用webdriver工具
url='' 指定要爬取网址
driver = webdriver.Chrome(r"C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe" )
webdriver.Chrome 是利用webdriver调用谷歌浏览器的驱动,用谷歌浏览器打开网页,当然也可以用其他的浏览器,这里是用谷歌。注意这里的Chrome的C是大写的,否则会报错。
driver.get(url) 用谷歌打开指定的网址
C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe这里是要下载个谷歌浏览器的驱动
根据谷歌浏览器的版本号对应下载chromedriver.exe 放入到浏览器的安装目录下
驱动的下载地址如下:
http://chromedriver.storage.googleapis.com/index.html
注:
win64可以下载32位使用
网友评论