美文网首页
scrapy中间件的使用

scrapy中间件的使用

作者: gogoforit | 来源:发表于2017-03-04 22:28 被阅读0次

首先创建middlewares.py文件,然后定义中间件类

class UAMiddleware(object):
  def process_request(self,request,spider):
        ua = random.choice(UA_LIST)
        request.header['User-Agent'] = ua  #这个是定义的随机user-agent

settings文件添加一个UA_LIST,即UA列表

UA_LIST = [
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"\
        "Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",\
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",\
        "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",\
        "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",\
        "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5",\
        "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5",\
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
        "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",\
        "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3",\
        "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",\
        "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"
       ]

然后在setting里面找到DOWNLOADER_MIDDLEWARES,然后这么设置一下

DOWNLOADER_MIDDLEWARES = {
   'midtest.middlewares.UAMiddleware': 543,
}

如果还有其他中间件,按照这个方式添加即可,定义类->配置settings文件

相关文章

  • 32.scrapy中间件的使用

    scrapy中间件的使用 学习目标: 应用 scrapy中使用间件使用随机UA的方法 应用 scrapy中使用代理...

  • 下载中间件

    scrapy下载中间件 中间件 是Scrapy里面的一个核心概念。使用中间件可以在爬虫的请求发起之前或者请求返回之...

  • [scrapy]scrapy爬取京东商品信息——以自营手机为例

    关于scrapy以及使用的代理轮换中间件请参考我的爬取豆瓣文章: 【scrapy】scrapy按分类爬取豆瓣电影基...

  • Scrapy管道及中间件个人常用配置示例

    中间件的使用示例: 随机UserAgent示例 使用fake_useragent生成随机UA 使用scrapy_f...

  • scrapy中的下载器中间件

    scrapy中的下载器中间件 下载中间件 下载器中间件是介于Scrapy的request/response处理的钩...

  • scrapy--middlewares(4)

    一、scrapy middlewares scrapy中间件主要有两种,下载中间件和spider中间件,以下是我们...

  • scrapy代理的设置

    scrapy代理的设置 在我的上一篇文章介绍了scrapy下载器中间件的使用,这里的scrapyIP的代理就是用这...

  • scrapy 使用中间件

    处理js渲染的内容 参考 【爬虫进阶-JS自动渲染】Scrapy_splash组件的使用https://blog....

  • scrapy中间件的使用

    首先创建middlewares.py文件,然后定义中间件类 settings文件添加一个UA_LIST,即UA列表...

  • Scrapy中间件的使用

    下载中间件 默认的中间件优先级为: 其中,数字低的更接近engine, 数字高的更接近downloader。如果要...

网友评论

      本文标题:scrapy中间件的使用

      本文链接:https://www.haomeiwen.com/subject/ninjgttx.html