美文网首页
Scrapy爬取所有股票的最新信息

Scrapy爬取所有股票的最新信息

作者: Acamy丶 | 来源:发表于2017-12-12 14:55 被阅读0次

    1. Scrapy框架

    如下图所示,Scrapy构架由五大组件(SPIDERS,ENGINE,SCHEDULER,DOWNLOADER,ITEM PIPELINES),两个中间件(SPIDERS到ENGINE,ENGINE到DOWNLOADER),三条数据流组成(①②,③④⑤⑥,⑦⑧),我们在使用时一般只需要通过genspider命令创建spider并编写处理逻辑,然后在pipelines里面对数据进行处理存储即可。


    Scrapy框架

    2. 爬取股票信息

    GitHub地址:https://github.com/Acamy/BaiduStocks

    1. 创建工程和spider文件
    scrapy startproject BaiduStocks
    cd BaiduStocks
    scrapy genspider stocks baidu.com
    
    1. 编写spider


      stocks.py
    2. 编写Pipelines


      pipelines.py

    4.配置settings.py


    settings.py
    1. 运行spider
    scrapy crawl stocks
    
    运行效果

    相关文章

      网友评论

          本文标题:Scrapy爬取所有股票的最新信息

          本文链接:https://www.haomeiwen.com/subject/crtnixtx.html