美文网首页
【为了尊严】爬虫(二)

【为了尊严】爬虫(二)

作者: 歌兮舞兮独酌兮 | 来源:发表于2018-09-30 23:48 被阅读3次

一、urllib

** urllib是python内置的请求库,不需要额外安装**

request:模拟发送请求,给库方法传入URL以及额外参数即可
error:异常处理模块,可以捕获异常,重新调试
parse:工具模块
1.urlopen()(发起基本请求和抓取)
(1)代码示例(输出各类信息)

import urllib.request
response = urllib.request.urlopen('https://www.python.org')
#print(response.read().decode('utf-8')) #read()输出整个网页
print(type(response),'\n') #输出响应类型
print(response.status) #输出状态码
print(response.getheaders()) #获得响应头
print(response.getheader('Server'))#获得响应头的server

函数原型

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

添加data参数后,请求方法就变成了POST

(2)代码示例(加上data参数)

import urllib.parse
import urllib.request

data = bytes(urllib.parse.urlencode({'word':'hello'}),encoding='utf-8')
#bytes()方法第一个参数要求是str,用urllib.parse.urlencode转化为str
response = urllib.request.urlopen('http://httpbin.org/post', data=data)
#form中出现传递的参数,以PSOT方式模拟了表单提交
print(response.read())

(3)代码示例(timeout)

import socket
import urllib.request
import urllib.error
 

#response = urllib.request.urlopen('http://httpbin.org/post', timeout=1)
#超时时间为1s
#print(response.read())

try:
    respinse = urllib.request.urlopen('http://httpbin.org/get', timeout=0.1)
except urllib.error.URLError as e:
    if isinstance(e.reason,socket.timeout):
        print('time out')

#isinstance 判断错误原因是否为超时

2.request

相关文章

  • 【为了尊严】爬虫(二)

    一、urllib ** urllib是python内置的请求库,不需要额外安装** request:模拟发送请求,...

  • 【为了尊严】爬虫(一)

    一、请求 1.GET&POST GET请求中的参数包含在URL里面,数据可以在URL中看到,而POST请求的URL...

  • 【为了尊严】Python(二)

    一 函数 1.给函数abs起“别名” 2.函数定义 3.空函数 4.import的使用 5.return 返回多值...

  • 为了尊严

    为了尊严, 他也曾狂傲, 不可一世; 为了尊严,他也曾绝情, 拒绝一切; 如今, 他不再为了尊严, 只为了那个“她...

  • 为了尊严

    我离开家的那天,母亲只对我说了几句话:无论走到哪里要有骨气!穷!咱不怕!但后背的脊梁不能比别人矮半截!要...

  • 为了尊严

    郑重声明:本文系作者原创首发,文责自负 我记得刚从大学毕业,找工作屡屡碰壁,阿爸于心不忍,决定找他的舅舅,也就是我...

  • 活着,为了尊严

    我曾无数次徘徊在 空旷无人的街道, 路灯和星光交相辉映, 我抬头望望夜空, 满天的星星在闪烁, 距离那么遥远。 日...

  • (33)为了尊严

    《心若菩提》---(为了国徽的尊严) 时间来到了1991年,福耀玻璃刚上市便筹集到了2000多万元。曹先生手头...

  • Python爬虫:花瓣美女 (*^▽^*)

    根据知乎专栏:爬虫从入门到精通中的相关内容,经过个人学习与改良,得到如下爬虫系列。 (男人,皆爱美。尊严让我们不能...

  • 一张图读懂Python爬虫与反爬虫大战!

    python爬虫与发爬虫的厮杀,一方为了拿到数据,一方为了防止爬虫拿到数据,谁是最后的赢家? 重新理解爬虫中的一些...

网友评论

      本文标题:【为了尊严】爬虫(二)

      本文链接:https://www.haomeiwen.com/subject/ngjgoftx.html