美文网首页
关于.shtml网页的爬取

关于.shtml网页的爬取

作者: nonoBoy | 来源:发表于2017-01-02 14:58 被阅读265次

近期在做一个王者荣耀的英雄APP,由于需要数据,于是用Python取官网抓数据,然而他家的网站是.shtml的,普通的方法urllib是抓不到数据的,后来通过selenium解决问题,会真实打开浏览器爬取代码,效率低一些,但是满足了本次要求;代码如下(记得安装selenuim包, 配置Firefox环境变量):

#coding = utf-8
#author: liutao
from selenium import web driver
from lxml import tree

browser = webdriver.Firefox()
browser.get('http://pvp.qq.com/web201605/herolist.shtml')
content = browser.page_source
print(content)

browser.quit() # 退出浏览器

相关文章

网友评论

      本文标题:关于.shtml网页的爬取

      本文链接:https://www.haomeiwen.com/subject/dfuwvttx.html