美文网首页
请求库安装

请求库安装

作者: 飘乐云 | 来源:发表于2021-03-17 23:17 被阅读0次

爬虫需要安装第三方库,requests、Selenium

(以下均只展示Windows系统下的操作)

1. 安装requests

pip install requests

requests 一个阻塞式HTTP请求库。

2. 安装Selenium

pip install selenium

Selenium 是一个自动化测试工具

(1) 官网下载ChromeDriver: ChromeDriver

随后再在程序中测试。执行如下Python 代码:

from selenium import webdriver

browser = webdriver.Chrome()

运行后,出现一个空白的Chrome 浏览器

(2) Geckodriver安装:geckodriver

随后再在程序中测试。执行如下Python 代码:

from selenium import webdriver

browser = webdriver.Firefox()

运行后,出现一个空白的Firefox 浏览器

3.安装PhantomJS

PhantomJS 是一个无界面的、可脚本编程的Web Kit 浏览器引擎,它原生支持多种Web 标准: DOM操作、css 选择器、JSON 、Canvas 以及SVG 。

在Selenium 中使用的话,我们只需要将Chrome 切换为PhantomJS 即可:

from selenium import webdriver

browser = webdriver. PhantomJS()

browser.get("https://www.baidu.com")

print(browser.current_url)

4.安装aiohttp

pip install aiohttp


Robots协议:规定了网站哪些数据不可以别爬虫。

查看网站的robots协议,如淘宝:

https://www.taobo.com/robots.txt

规定了不可以爬的数据,爬了可能要承担法律风险,可以“防君子不防小人”

相关文章

  • 01_依赖库的安装

    请求库的安装 requests:阻塞式http请求库$ pip install requests selenium...

  • swift 网络请求框架 Alamofire

    使用cocoapods安装网络请求库 Alamofire 默认是get请求 get 请求 post 请求

  • 爬取网红小姐姐图片(简单入门)

    简单爬虫 安装第三方库请求页面解析网页保存图片 安装第三方库 安装第三方请求库(requests)pip inst...

  • 请求库安装

    爬虫程序分为三步:1.抓取页面2.分析页面3.存储数据在抓取页面时需要模拟浏览器向服务器发送请求,所以需要一些Py...

  • 请求库安装

    爬虫需要安装第三方库,requests、Selenium (以下均只展示Windows系统下的操作) 1. 安装r...

  • Python请求库安装

    请求库安装 爬虫可以简单分为几步:抓取页面、分析页面和存储数据 requests 安装 pip3 install ...

  • 【为了尊严】爬虫(二)

    一、urllib ** urllib是python内置的请求库,不需要额外安装** request:模拟发送请求,...

  • 爬虫技术(1) 前置知识与架构

    1. requests 库的使用 安装 发送请求 (1)请求方式 Get 查看资源 POST 增加资源 PUT 修...

  • Python爬虫库的安装

    首先,安装request爬虫库: 作用 : 相当于浏览器 客户端发送请求 安装:p...

  • Python网络——Urllib&Requests

    Urllib Urllib 库,它是 Python 内置的 HTTP 请求库.不需要额外安装即可使用,在 Pyth...

网友评论

      本文标题:请求库安装

      本文链接:https://www.haomeiwen.com/subject/rxoecltx.html