selenium+ChromeDriver
所有chromedriver下载地址
http://chromedriver.storage.googleapis.com/index.html
selenium之 chromedriver与chrome版本映射表参考该博客
http://blog.csdn.net/huilan_same/article/details/51896672
配置
将chromedriver.exe直接放置在chrome.exe同目录下
selenium+ChromeDriver.png代码
from selenium import webdriver
import time
#复制chromdriver路径
driver_path = r'C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe'
driver = webdriver.Chrome(executable_path=driver_path)
driver.get("http://www.acfun.cn/")
#让浏览器停留
time.sleep(1)
driver.close()
selenium+Geckodriver
Firefox的驱动器Geckodriver似乎无需像Chrome那样,根据浏览器版本选择匹配的驱动器版本。
geckodriver下载地址
https://github.com/mozilla/geckodriver/releases
配置
selenium+Geckodriver.png代码
from selenium import webdriver
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
import time
driver_path = r'C:\Program Files (x86)\Mozilla Firefox\geckodriver.exe'
binary = FirefoxBinary(r'C:\Program Files (x86)\Mozilla Firefox\firefox.exe')
driver = webdriver.Firefox(firefox_binary=binary,executable_path=driver_path)
driver.get("http://www.acfun.cn/")
#让浏览器停留
time.sleep(5)
driver.close()
selenium+Phantomjs
phantomjs用于异步加载,也就是动态网页的抓取。PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。任何你可以在基于webkit浏览器 做的事情,它都能做到。它不仅是个隐形的浏览器,提供了诸如CSS选择器、支持Web标准、DOM操作、JSON、HTML5、Canvas、SVG等, 同时也提供了处理文件I/O的操作,从而使你可以向操作系统读写文件等。PhantomJS的用处可谓非常广泛,诸如前端无界面自动化测试(需要结合 Jasmin)、网络监测、网页截屏等。
PhantomJS安装
在下面的网站选择合适的版本安装
装好解压后,把文件夹bin中的phantomjs.exe移到python安装文件夹中,至此,就已经在Win的环境下配置好了环境。
配置
selenium+Phantomjs.png代码
from selenium import webdriver
driver_path = r'C:\Users\lenovo\AppData\Local\Programs\Python\Python35\phantomjs.exe'
base_url = "http://hotel.qunar.com/"
driver = webdriver.PhantomJS(executable_path=driver_path)
driver.get(base_url)
html = driver.title
print(html)
driver.close()
网友评论