美文网首页
scrapy shell 参数

scrapy shell 参数

作者: Manchangdx | 来源:发表于2019-01-12 11:42 被阅读0次

一、--no-redirect

无此参数,默认自动重定向,有此参数就不会重定向了
终端执行:

scrapy shell https://www.shiyanlou.com/user/310176

结果如下:

[s]   request    <GET https://www.shiyanlou.com/user/310176>
[s]   response   <200 https://www.shiyanlou.com/teacher/310176>

终端执行:

scrapy shell --no-redirect https://www.shiyanlou.com/user/310176

结果如下:

[s]   request    <GET https://www.shiyanlou.com/user/310176>
[s]   response   <301 https://www.shiyanlou.com/user/310176>

二、-s

增加参数,常用的参数是 USER_AGENT ,当命令结果出现 403 时,用此参数
终端执行:

scrapy shell https://movie.douban.com/subject/3011091/

结果如下:

[s]   request    <GET https://movie.douban.com/subject/3011091/>
[s]   response   <403 https://movie.douban.com/subject/3011091/>

终端执行:

scrapy shell -s USER_AGENT='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1
)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36' 
https://movie.douban.com/subject/3011091/

结果如下:

[s]   request    <GET https://movie.douban.com/subject/3011091/>
[s]   response   <200 https://movie.douban.com/subject/3011091/>

如果创建了爬虫项目,也可以修改 settings.py 文件中的 USER_AGENT 字段

相关文章

网友评论

      本文标题:scrapy shell 参数

      本文链接:https://www.haomeiwen.com/subject/cngqdqtx.html