美文网首页Python爬虫笔记
python爬虫day-7(urllib库-处理异常)

python爬虫day-7(urllib库-处理异常)

作者: 南音木 | 来源:发表于2019-04-11 15:23 被阅读0次

    个人学习笔记,方便自己查阅,仅供参考,欢迎交流

    基本的请求库urllib—异常处理

    urllib库的error模块定义了由request模块产生的异常如果出现了问题,request 模块便会抛出error 模块中定义的异常。

    1.URLError

    URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由request模块生的异常都可以通过捕获这个类来处理。

    from urllib import request,error
    try:
        response = request.urlopen('http://www.destinystar.cn/index.htm')
    except error.URLError as e:
        print(e.reason) 
    
    2.HTTPError

    它是URLError 的子类,专门用来处理HTTP请求错误,比如认证请求失败等。

    • code:返回 HTTP状态码,比如404表示网页不存在,500 表示服务器内部错误等。
    • reason:同父类一样,用于返回错误的原因。
    • headers:返回请求头。
    from urllib import request,error
    try:
        response = request.urlopen('http://www.destinystar.cn/index.htm')
    except error.HTTPError as e:
        print(e.reason,e.code,e.headers,sep='\n')
    
    from urllib import request,error
    try:
        response = request.urlopen('http://www.destinystar.cn/index.htm')
    except error.HTTPError as e:
        print(e.reason,e.code,e.headers,sep='\n')
    except error.URLError as  e:
        print(e.reason)
    else:
        print('Request Successfully')
    
    import socket
    import urllib.request
    import urllib.error
    
    try:
        response = urllib.request.urlopen('https://www.baidu.com',timeout=0.01)  
    except urllib.error.URLError as e:
        print(type(e.reason))
        if isinstance(e.reason,socket.timeout):
            print('TIME OUT')
    

    相关文章

      网友评论

        本文标题:python爬虫day-7(urllib库-处理异常)

        本文链接:https://www.haomeiwen.com/subject/ibiniqtx.html