美文网首页
2.常用的爬虫模块及使用方法

2.常用的爬虫模块及使用方法

作者: _无名人 | 来源:发表于2017-11-07 15:11 被阅读0次

常用的爬虫模块及使用方法

python的urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。他们两个最显着的差异如下:

urllib2可以接受一个Reques对象,并以此可以来设置一个URL的headers,但是urllib只接收一个URL。这意味着,你不能伪装你的用户代理字符串等。

urllib模块可以提供进行urlencode的方法,该方法用于GET查询字符串的生成,urllib2的不具有这样的功能。这就是urllib与urllib2经常在一起使用的原因。

常用的方法

1 urllib2.urlopen(url[, data][, timeout])

urlopen方法是urllib2模块最常用也是最简单的方法,它打开URL网址,url参数可以是一个字符串url或者是一个Request对象。URL没什么可说的,Reques对象和data在reques类中说明,定义都是一样的。

相关文章

  • 2.常用的爬虫模块及使用方法

    常用的爬虫模块及使用方法 python的urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同...

  • 2,常用的爬虫模块及使用方法

    Requests模块 发送请求使用 Requests 发送网络请求非常简单。 一开始要导入 Requests 模块...

  • os模块

    os模块中关于文件/目录常的函数使用方法 os.path模块中关于路径常用的函数使用方法

  • bs4

    Python爬虫常用模块,BeautifulSoup笔记 – 麦穗技术 Beautiful Soup 4.2.0 ...

  • python基础学习(三)

    常用模块 String模块 数学模块 随机模块 OS模块 os.path模块 re模块 常用函数及操作 列表操作 ...

  • (二)爬虫框架(2)——第一个scrapy爬虫

    scrapy简介中简单介绍了scrapy爬虫,这节就深入的研究一下scrapy的各个模块的使用方法。 首先创建爬虫...

  • scrapy深度爬虫——01爬虫模块

    爬虫模块 # -*- coding: utf-8 -*- '''深度爬虫:采集工作信息及分页深度采集''' # 引...

  • python之函数常用小技巧

    1. 字符串处理方法:strip()函数 1.1 原型及使用方法 1.2 strip()函数的常用扩展 2. ra...

  • Python基础-常用内置模块

    Python基础-常用内置模块 1.urllib 爬虫 2.os 控制操作系统的模块 3.webbrowser...

  • 2018-09-09

    os模块中关于文件/目录常用的函数使用方法 函数名使用方法 getcwd() 返回当前工作目录 chdir(pat...

网友评论

      本文标题:2.常用的爬虫模块及使用方法

      本文链接:https://www.haomeiwen.com/subject/olljmxtx.html