Scrapy

作者: 先爔 | 来源:发表于2019-10-09 20:02 被阅读0次

Scrapy简介


Scrapy是一个健壮的网络框架,它可以从各种数据源中抓取数据。
Scrapy能够识别残缺的HTML。
Scrapy既不存储数据,也不索引数据。它只用于抽取数据。它对很多数据库也都有所支持。

安装Scrapy


因为我安装了Anaconda,所以直接在其下面安装

conda install scrapy

shell命令

进入scrapy的URL调试控制台

scrapy shell [--pdb] www.xxx.com

--pdb: 启用交互式调试

第一个Scrapy项目

scrapy startproject properties

编写爬虫

创建一个名为basic的默认爬虫

scrapy genspider basic 网址

运行爬虫

scrapy crawl 爬虫名
scrapy parse --spider=爬虫名 网址

保存文件

scrapy crawl 爬虫名 -o xxx.json
scrapy crawl 爬虫名 -o xxx.jl
scrapy crawl 爬虫名 -o xxx.csv
scrapy crawl 爬虫名 -o xxx.xml

Item加载器

ItemLoader

相关文章

  • 简单 Scrapy 使用小结

    Scrapy 安装Scrapy pip install scrapy Scrapy Doc 查看Scrapy的文档...

  • scrapy框架

    一、scrapy简介 二、scrapy原理 三、scrapy工作流程 四、scrapy框架的创建 五、scrapy...

  • Scrapy笔记

    Scrapy笔记 安装scrapy框架: 安装scrapy:通过pip install scrapy即可安装。 如...

  • scrapy笔记

    1 scrapy的运行原理 参考:Learning Scrapy笔记(三)- Scrapy基础Scrapy爬虫入门...

  • Scrapy基础(一): 安装和使用

    安装 新建scrapy项目 目录 scrapy模板 使用pycharm调试scrapy执行流程 scrapy 终端...

  • python爬虫13:scrapy

    scrapy的结构 scrapy的工作原理 scrapy的用法

  • Scrapy笔记

    Scrapy笔记 pip 指定源安装模块 创建Scrapy项目 创建Scrapy爬虫程序 启动Scrapy爬虫 在...

  • PyCharm运行和调试Scrapy

    前言: PyCharm运行和调试Scrapy,首先需要安装Scrapy,安装Scrapy请点链接Scrapy的安装...

  • 11- Scrapy-Redis分布式

    Scrapy和Scrapy-Redis的区别 安装Scrapy-Redis Scrapy-Redis介绍 提供了下...

  • scrapy框架基本使用

    scrapy基本介绍 scrapy VS requests Mac安装 conda install scrapy ...

网友评论

      本文标题:Scrapy

      本文链接:https://www.haomeiwen.com/subject/wvhkuctx.html