美文网首页Python爬虫笔记
python爬虫day-7(urllib库-处理异常)

python爬虫day-7(urllib库-处理异常)

作者: 南音木 | 来源:发表于2019-04-11 15:23 被阅读0次

个人学习笔记,方便自己查阅,仅供参考,欢迎交流

基本的请求库urllib—异常处理

urllib库的error模块定义了由request模块产生的异常如果出现了问题,request 模块便会抛出error 模块中定义的异常。

1.URLError

URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由request模块生的异常都可以通过捕获这个类来处理。

from urllib import request,error
try:
    response = request.urlopen('http://www.destinystar.cn/index.htm')
except error.URLError as e:
    print(e.reason) 
2.HTTPError

它是URLError 的子类,专门用来处理HTTP请求错误,比如认证请求失败等。

  • code:返回 HTTP状态码,比如404表示网页不存在,500 表示服务器内部错误等。
  • reason:同父类一样,用于返回错误的原因。
  • headers:返回请求头。
from urllib import request,error
try:
    response = request.urlopen('http://www.destinystar.cn/index.htm')
except error.HTTPError as e:
    print(e.reason,e.code,e.headers,sep='\n')
from urllib import request,error
try:
    response = request.urlopen('http://www.destinystar.cn/index.htm')
except error.HTTPError as e:
    print(e.reason,e.code,e.headers,sep='\n')
except error.URLError as  e:
    print(e.reason)
else:
    print('Request Successfully')
import socket
import urllib.request
import urllib.error

try:
    response = urllib.request.urlopen('https://www.baidu.com',timeout=0.01)  
except urllib.error.URLError as e:
    print(type(e.reason))
    if isinstance(e.reason,socket.timeout):
        print('TIME OUT')

相关文章

网友评论

    本文标题:python爬虫day-7(urllib库-处理异常)

    本文链接:https://www.haomeiwen.com/subject/ibiniqtx.html