scrapy爬取豆瓣电影403

scrapy爬取豆瓣电影403

作者: 昵称不再更新 | 来源:发表于2018-09-10 23:59 被阅读0次

scrapy爬取豆瓣电影403
scrapy爬取豆瓣电影
[scrapy]scrapy爬取京东商品信息——以自营手机为例
Scrapy爬取豆瓣电影
scrapy爬取豆瓣电影
scrapy爬取豆瓣电影
scrapy爬取豆瓣电影
scrapy 爬虫初体验(1)
scrapy爬取豆瓣电影top250
基于scrapy爬取豆瓣电影

入手学习scrapy，简单学习的官网的demohttps://doc.scrapy.org/en/latest/intro/tutorial.html以后，试着爬取豆瓣。建立好项目以后，先用scrapy shell https://movie.douban.com/top250尝试，结果返回了403，首先想到是要增加user-agent头，于是按照网上的方法分别尝试

在settings.py 里面增加 user_agent 信息，结果仍然返回403
使用scrapy shell -s user_agent= xxx url ，结果仍然返回403

最后尝试在setting中不仅仅增加user_agent信息，添加了以下信息后可以正确访问豆瓣了，基本上就是浏览器中除了cookie的其他信息了吧。

DEFAULT_REQUEST_HEADERS = {
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language':'zh-CN,zh;q=0.9',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'Host': 'music.douban.com',
'Upgrade-Insecure-Requests':' 1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
}

相关文章

scrapy爬取豆瓣电影403
入手学习scrapy，简单学习的官网的demohttps://doc.scrapy.org/en/latest/i...
scrapy爬取豆瓣电影
scrapy爬取豆瓣电影，存储在MongoDB 本节分享用的Scrapy爬取豆瓣电影Top250的实战。本节要实...
[scrapy]scrapy爬取京东商品信息——以自营手机为例
关于scrapy以及使用的代理轮换中间件请参考我的爬取豆瓣文章：【scrapy】scrapy按分类爬取豆瓣电影基...
Scrapy爬取豆瓣电影
1.在items.py中定义字段，这些字段用来保存数据，方便后续的操作 2.修改settings.py对项目进行配...
scrapy爬取豆瓣电影
修改了豆瓣电影的名字个数以及利用正则表达式只留下评分人数中的数字
scrapy爬取豆瓣电影
目标网站：http://movie.douban.com/top250 目标内容：电影名称电影信息电影评分 ...
scrapy爬取豆瓣电影
摘要通过scrapy框架爬取豆瓣top250电影，并保存为文件 1．引言随着网络的迅速发展，互联网成为大量信息...
scrapy 爬虫初体验(1)
目录前言 scrapy 数据流 scrapy 组件爬取豆瓣电影 Top250 后记送书后话前言为什么要学...
scrapy爬取豆瓣电影top250
学习scrapy，总结下使用scrapy爬取豆瓣电影的demo，以及中间遇到的问题。核心就是一个spider和一...
基于scrapy爬取豆瓣电影
scrapy爬虫一共需要四步新建项目 (scrapy startproject xxx)：新建一个新的爬虫项目 ...

网友评论

本文标题：scrapy爬取豆瓣电影403

本文链接：https://www.haomeiwen.com/subject/pqfygftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|scrapy爬取豆瓣电影403|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！