美文网首页程序员python 高级码农成才之路
创建scrapy爬虫项目以及scrapy框架的文件介绍

创建scrapy爬虫项目以及scrapy框架的文件介绍

作者: 幼姿沫 | 来源:发表于2020-12-15 08:26 被阅读0次

一   1. 在window命令提示符里面创建scrapy项目

python -m scrapy startproject + name

scrapy startproject + name

2.在window命令提示符里面的scrapy项目中创建爬虫名称和网址

python -m scrapy genspider +spider_name  +  url  (不加双引号/单引号)

scrapy genspider +spider_name  +  url 

3.在window命令提示符里面的scrapy项目中创建爬虫名称和网址  之后运行爬虫项目

python -m scrapy crawl +spider_name

scrapy crawl +spider_name

在pycharm的terminal中创建scrapy爬虫项目

二   1.在pycharm中创建scrapy项目爬虫请求响应的步骤

文件说明:

scrapy.cfg项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中)

items.py设置数据存储模板,用于结构化数据,如:Django的Model

pipelines.py数据处理行为,如:一般结构化的数据持久化

settings.py配置文件,如:递归的层数、并发数,延迟下载等

spiders爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

创建写爬虫的文件

# scrapy genspider +名称 + '网站'

#建立爬虫文件 

scrapy genspider itcast"itcast.cn"

2.创建完之后文件结构

注意:

相关文章

网友评论

    本文标题:创建scrapy爬虫项目以及scrapy框架的文件介绍

    本文链接:https://www.haomeiwen.com/subject/kwqvgktx.html