关于Scrapy

关于Scrapy

作者: idri | 来源:发表于2017-09-11 14:40 被阅读0次

python爬虫使用scrapy框架爬取顶点小说网
scrapy相关专题总结
[scrapy]scrapy爬取京东商品信息——以自营手机为例
关于Scrapy
分布式爬虫笔记（一）- 非框架实现的Crawlspider
爬虫-scrapy快速入门
Python爬虫Scrapy框架：关于scrapy中scrapy
scrapy 关于session
关于scrapy框架
关于scrapy使用

image.png

Requests
Responses

Downloaders Middlewares
Spider Middlewares

1、Engine向spider请求第一个URL
2、Engine获取URL拿给调度器（scheduler）调度
3、Engine向Scheduler请求下一个要爬取的URL
4、Scheduler返回URL给Engine，Engine通过Downloader Middlewares转发给Downloader这个Request
5、下载完毕，Downloader生成Response通过DM发给Engine
6、Engine接受Response通过Spider Middlewares发给Spider
7、Spider处理Response并返回爬取的Items、Request发送给Engine
8、Engine将Items发送给Item Pipeline，将Request发送给Scheduler
9、重复2，直到Spider中Request全部处理完毕

items：包含item
pipelines：对item处理，清洗、验证、持久化
setting：配置middlewares
spiders>
start_request：返回request给Scheduler
parse：解析页面，返回item给pipelines

代理IP
Cookie
登录方法：1.添加cookies 2.FormRequest：在parse中返回一个FormRequest，包含参数formdata字典，字典包含account/csrf_token/grant_type/redirect_url等值

其他处理：cookies middleware

JS
1.selenium
模拟浏览器 webbdriver_Firefox().get(url)
查看浏览器网络，XHR，找到js产生的请求，返回的是JSON。
Scrapyd 部署运行scrapy的应用，使用JSON API部署工程

相关文章

python爬虫使用scrapy框架爬取顶点小说网
1.scrapy的安装这个安装教程，网上有很多的例子，这里就不在赘述了 2.关于scrapy scrapy框架 ...
scrapy相关专题总结
本月的scrapy已经写完，关于scrapy写了常用的中间件、数据管道、以及scrapy的相关源码，但是感觉可写的...
[scrapy]scrapy爬取京东商品信息——以自营手机为例
关于scrapy以及使用的代理轮换中间件请参考我的爬取豆瓣文章：【scrapy】scrapy按分类爬取豆瓣电影基...
关于Scrapy
RequestsResponses Downloaders MiddlewaresSpider Middlewar...
分布式爬虫笔记（一）- 非框架实现的Crawlspider
不久前写过一篇使用Scrapy框架写的Crawlspider爬虫笔记（五）- 关于Scrapy 全站遍历Crawl...
爬虫-scrapy快速入门
1. scrapy 概述官方网站：https://scrapy.org/，打开官方网站，可以看到一段关于scra...
Python爬虫Scrapy框架：关于scrapy中scrapy
一.源码一.url(必须) 填写的参数:请求的地址数据类型:str 二.callback 填写的参数:响应返回...
scrapy 关于session
在requests用session登陆这篇讲了怎么用同一个session控制cookies以达到登陆的需求，在sc...
关于scrapy框架
Scrapy的安装介绍 Scrapy框架官方网址：http://doc.scrapy.org/en/latest ...
关于scrapy使用
https://docs.scrapy.org/en/latest/intro/tutorial.html 这个链...

网友评论

本文标题：关于Scrapy

本文链接：https://www.haomeiwen.com/subject/zlqfsxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|关于Scrapy|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！