美文网首页
scrapy设置随机请求头的两种方法

scrapy设置随机请求头的两种方法

作者: june雨上 | 来源:发表于2018-01-25 21:29 被阅读0次

    1.在settings.py中设置USER_AGENT_LIST

    需要先导入random模块

    然后在meddlewares.py中创建RandomUserAgentMiddleWare()类.重写scrapy内置的UserAgentMiddleware.

    这种最后需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

    2.通过pip install fake-useragent,从而直接通过fake_useragent第三方库来随机生成请求头.

    需要先导入UserAgent

    from fake_useragen timport UserAgent

    需要在settings.py中设置

    # 用于配置随机user-agent的类型,如果值是random,表示任意随机一个;如果配置的是chrome,则只随机chrome中的user-agent.

    RANDOM_UA_TYPE ='chrome'

    最后同上面一样需要在settings.py中设置DOWNLOAD_MIDDLEWARES,将系统默认的随机请求头给禁掉,再添加我们自己定义的随机UserAgent

    相关文章

      网友评论

          本文标题:scrapy设置随机请求头的两种方法

          本文链接:https://www.haomeiwen.com/subject/pwsbaxtx.html