美文网首页
Scrapy爬取所有股票的最新信息

Scrapy爬取所有股票的最新信息

作者: Acamy丶 | 来源:发表于2017-12-12 14:55 被阅读0次

1. Scrapy框架

如下图所示,Scrapy构架由五大组件(SPIDERS,ENGINE,SCHEDULER,DOWNLOADER,ITEM PIPELINES),两个中间件(SPIDERS到ENGINE,ENGINE到DOWNLOADER),三条数据流组成(①②,③④⑤⑥,⑦⑧),我们在使用时一般只需要通过genspider命令创建spider并编写处理逻辑,然后在pipelines里面对数据进行处理存储即可。


Scrapy框架

2. 爬取股票信息

GitHub地址:https://github.com/Acamy/BaiduStocks

  1. 创建工程和spider文件
scrapy startproject BaiduStocks
cd BaiduStocks
scrapy genspider stocks baidu.com
  1. 编写spider


    stocks.py
  2. 编写Pipelines


    pipelines.py

4.配置settings.py


settings.py
  1. 运行spider
scrapy crawl stocks
运行效果

相关文章

网友评论

      本文标题:Scrapy爬取所有股票的最新信息

      本文链接:https://www.haomeiwen.com/subject/crtnixtx.html