美文网首页
Scrapy指令笔记

Scrapy指令笔记

作者: 挠叔 | 来源:发表于2018-03-06 20:58 被阅读8次

fetch 可以直接获取一个网页
genspider 创建爬虫文件
runspider 运行一个爬虫
settings 爬虫配置相关
shell 进入交互页面
startproject 创建一个爬虫项目

创建一个爬虫项目
scrapy startproject cw(文件名)
cw 核心目录 scrapy.cfg 整个爬虫项目的配置
spiders 所有的爬虫文件都会放在spiders文件夹里面
init.py初始化文件 不用管
iterms.py 定义一些爬去目标 (比如爬当当网 上的书内容还是价格还是图片 爬什么就是目标 全部写在items.py里)
middlewares.py 中间键。 在爬去中间 中间都经历了什么。 (代理IP池 )
pipelines.py 爬去后数据你要做什么是写入什么东西 还是干什么

settings.py全局的
item(爬虫目标)->spiders(爬虫文件)->pipelines(数据处理)

sprapy指令
全局指令 项目指令

crawl 运行一个爬虫文件
edit 编辑一个爬虫文件
list 看一下当前爬虫项目下的爬虫文件

scrapy fetch http://www.baidu.com 获取百度

不创建爬虫项目单独 运行爬虫文件

scrapy shell http://www.baidu.com 进入python》〉》模式
exit() 退出

scrapy view http://news.163.com 将数据下载到本地并且在浏览器中打开

scrapy check +文件名 检查爬虫是否可行

scrapy crawl 文件 —nolog 运行爬虫并不打印日志

scrapy list 当前有可运行的爬虫

相关文章

  • Scrapy指令笔记

    fetch 可以直接获取一个网页genspider 创建爬虫文件runspider 运行一个爬虫settings ...

  • Scrapy笔记-常用指令

    常用指令 创建项目 设置一个新的Scrapy项目。 运行爬虫 数据提取测试 css选择器 使用 shell,您可以...

  • python3.6安装scrapy框架

    网络爬虫,python3.6安装scrapy框架,cmd指令:pip install scrapy 由于Scrap...

  • Scrapy爬虫项目学习

    一、创建scrapy项目 1.安装scrapy环境 2.在指令目录创建scrapy工程 二、创建爬虫文件 Scra...

  • Scrapy笔记

    Scrapy笔记 安装scrapy框架: 安装scrapy:通过pip install scrapy即可安装。 如...

  • scrapy笔记

    1 scrapy的运行原理 参考:Learning Scrapy笔记(三)- Scrapy基础Scrapy爬虫入门...

  • Scrapy笔记

    Scrapy笔记 pip 指定源安装模块 创建Scrapy项目 创建Scrapy爬虫程序 启动Scrapy爬虫 在...

  • scrapy学习笔记(有示例版)

    scrapy学习笔记(有示例版) 我的博客 scrapy学习笔记1.使用scrapy1.1创建工程1.2创建爬虫模...

  • Scrapy常见指令

    在cmd里输入scrapy。 创建一个简单项目 首先打开cmd,进入要存放项目的文件夹 在scrapy目录下新建一...

  • Python爬虫scrapy框架

    环境安装 pip install scrapy测试在终端里录入scrapy指令,没有报错即表示安装成功! 创建一个...

网友评论

      本文标题:Scrapy指令笔记

      本文链接:https://www.haomeiwen.com/subject/iyorfftx.html