美文网首页
Scrapy框架的另类介绍

Scrapy框架的另类介绍

作者: 会健身爱吃水果的鱼 | 来源:发表于2019-05-08 15:54 被阅读0次

目前在学习python爬虫方面的东西。直到遇到了scrapy这个框架,然后死活理解不了,为了避免陷入思维定式,所有就大胆的来想想。

今天就只介绍scrapy的框架图谱和它的运行过程。其他的东西在后期学习中在进行补充。

正常版介绍scrapy的框架图谱。


image.png

scrapy的流程介绍:


image.png

这些类内容均来自与网上,各位随意在网上搜索得到。

接下来就是一些自己的类比想法:

scrapy engine = 办公室
scheduler = 行政部
downloader = 市场部
spider = 科研部
item pipeline = 仓储部
中间键 == 内勤部 (本次开脑洞的时候,没有算在来,下次补充)

办公室是一个神奇的地方,它统管其他部门,所有大事情都需要经过办公室的同意。
1、有一天科研部(spider)发现了一条很有用的url线索,报告给办公室,说:“这是一条萌萌的url,很是有用,我们应该好好利用一下。”
2、办公室看了看说:“科研部干的不错,来呀,把这条有用的url交给行政部,去搞一搞嘛。”
3、行政部,看着眼前这条瑟瑟发抖的url。用中指推一下反光的眼镜,嘴角泛起暗笑,大手一挥,高喊:“来呀,行政部的兄弟们,我来给这个小弟嘚包装一下,保证将它的长处发挥到最长。”
4、行政部一脸得意,看着自己的杰作,将萌萌的url包装成帅帅的newurl。送到办公室。
5、办公室搓搓了满是胡茬的下巴,内心宛若癫狂,表面却镇定无比的吩咐:“快,将这个newurl给市场部送去。让他们给我弄来response那群小妖精。”
6、市场部不负众望从市场(INTERNET)中弄来了一群response。交给办公室。
7、办公室大喊:“快将,这个小妖精给科研部送去,让他们将找出其中的极品送到仓储部,等待享用。”
8、科研部在提取了这群response中的极品送到了仓储部。然后又发现了新的,很有用的,萌萌的url,送到办公室,又开始了新的轮回。

相关文章

网友评论

      本文标题:Scrapy框架的另类介绍

      本文链接:https://www.haomeiwen.com/subject/fvomoqtx.html