爬虫的异常处理

作者: 薛落花随泪绽放 | 来源:发表于2017-10-29 11:30 被阅读35次

爬虫在运动的过程中,很多时候都会遇到这样或那样的异常。如果没有异常处理,爬虫遇到异常时就会直接崩溃停止运行,下次再次运行时,又会重头开始。

常见状态码及含义

301 Moved Permanently : 重定向到新的URL,永久性

302 Found :重定向到临时的URL,非永久性

304 Not Modified : 请求的资源未更新

400 Bad Request : 非法请求

401 Unauthorized : 请求未经授权

403 Forbidden : 禁止访问

404 Not Found : 没有找到对应页面

500 Internal Server Error : 服务器内部出现错误

501 Not Implemented : 服务器不支持实现请求所需要的功能

URLError与HTTPError

两者都是一场处理的类,HTTPError是URLError的子类。

···

异常处理

'''
URLError出现的原因:
1)连不上服务器
2)远程url不存在
3)无网络
4)触发HTTPError
'''

import urllib.request
import urllib.error
try:
urllib.request.urlopen("http://blog.csdn.net")
except urllib.error.URLError as e:
if hasattr(e,"code"):
print(e.code)
if hasattr(e,"reason"):
print(e.reason)
···

爬虫的浏览器伪装技术

浏览器伪装技术

#浏览器伪装
import urllib.request
url="http://blog.csdn.net"
#头文件格式header=("User-Agent",具体用户代理值)
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
data=opener.open(url).read()
fh=open("E:/python/python爬虫/ua.html","wb")
fh.write(data)
fh.close()
# 需要研究的问题
# 1、如何将opener安装为全局,让urlopen()访问时也添加对应报头?
# 2、研究一下使用Request的方式进行报头添加。

相关文章

  • Python数据分析与挖掘之爬虫异常处理

    异常处理概述 爬虫在运行的过程中,很多时候都会遇到这样或那样的异常。如果没有异常处理,爬虫遇到异常的时候就会直接奔...

  • 爬虫的异常处理

    爬虫在运动的过程中,很多时候都会遇到这样或那样的异常。如果没有异常处理,爬虫遇到异常时就会直接崩溃停止运行,下次再...

  • Python爬虫day3.2—python异常处理

    异常处理概述 python程序在执行的时候,经常会遇到异常,如果中间异常不处理,经常会导致程序崩溃。比如爬虫,如果...

  • Python异常处理

    异常处理概述 Python程序在执行的时候,经常会遇到异常,如果中间异常不处理,经常会导致程序崩溃。比如后面写爬虫...

  • 「爬虫」05爬虫过程异常处理

    1.返回异常状态码的含义 301 Moved Permanently:重定向到新的URL,永久性302 Found...

  • 7、web爬虫讲解—urllib库爬虫—状态吗—异常处理—浏览器

    如果爬虫没有异常处理,那么爬行中一旦出现错误,程序将崩溃停止工作,有异常处理即使出现错误也能继续执行下去 1.常见...

  • python 爬虫之URLError异常处理

    1.URLError 产生URLError的原因:1.网络无连接,即本机无法上网2.连接不到特定的服务器3.服务器...

  • 同步或异步异常处理

    同步或异步异常处理 同步读取异常处理 异步读取文件异常处理

  • Java 异常

    异常处理机制 异常处理模型:终止模型:当异常发生时,就进入异常处理程序,处理结束并不返回异常发生位置继续执行;恢复...

  • 第十二章:异常处理

    异常处理语法格式: try: ...处理语句 except 异常类型: ...异常处理语句 pytho...

网友评论

    本文标题:爬虫的异常处理

    本文链接:https://www.haomeiwen.com/subject/mvzepxtx.html