urllib的用法

作者: 爽爽ing | 来源:发表于2018-12-22 15:06 被阅读0次

Urllib库是Python中的一个功能强大、用于操作URL，并在做爬虫的时候经常要用到的库。
在我们爬取一个网页的时候,首先要导入一个库
一、发送请求

使用 Urllib 的 request 模块我们可以方便地实现 Request 的发送并得到 Response
1、urlopen()

urllib.request 模块提供了最基本的构造 HTTP 请求的方法，利用它可以模拟浏览器的一个请求发起过程，同时它还带有处理authenticaton（授权验证），redirections（重定向)，cookies（浏览器Cookies）以及其它内容。
我们来感受一下它的强大之处，以 Python 官网为例，我们来把这个网页抓下来：
import urllib.request

response = urllib.request.urlopen('https://www.baidu.com')
print(response.read().decode('utf-8'))

data参数

data 参数是可选的，如果要添加 data，它要是字节流编码格式的内容，即 bytes 类型，通过 bytes() 方法可以进行转化，另外如果传递了这个 data 参数，它的请求方式就不再是 GET 方式请求，而是 POST。

下面请看一下简单的爬取豆瓣网登录页面的代码

网友评论

本文标题：urllib的用法

本文链接：https://www.haomeiwen.com/subject/aupikqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

urllib的用法

下面请看一下简单的爬取豆瓣网登录页面的代码

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读