scrapy

作者: 丫丫姑娘_b55e | 来源:发表于2018-10-17 09:30 被阅读0次

    创建项目
    scrapy startproject dbspider
    文件说明:

    scrapy.cfg:项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)

    items.py:设置数据存储模板,用于结构化数据,如:Django的Model

    pipelines:数据处理行为,如:一般结构化的数据持久化

    settings.py:配置文件,如:递归的层数、并发数,延迟下载等

    spiders:爬虫目录,如:创建文件,编写爬虫规则。

    在spiders文件中创建爬虫的时候,一般以爬取的网站的域名为爬虫的名称
    运行项目scrapy crawl qidian

    相关文章

      网友评论

          本文标题:scrapy

          本文链接:https://www.haomeiwen.com/subject/eldlzftx.html