美文网首页
scrapy框架基本使用

scrapy框架基本使用

作者: 不做大哥好多年 | 来源:发表于2017-05-16 15:32 被阅读51次

scrapy基本介绍

scrapy VS requests


Mac安装 conda install scrapy

    conda  是Anaconda 提供一个管理工具

安装后测试scrapy -h

scrapy框架分7个部分

“5+2”结构:ITEM PIPELINES,SPIDERS,ENGINE,SCHEDULER,DOWNLOADER,另外在SPIDERS和ENGINE、ENGINE和DOWNLOADER两个中间键模块MIDDLEWARE

Downkoader Middleware用户可以编写配置代码

目的:实施Engine、Scheduler和Downloader之间进行用户可配置的控制

功能:修改、丢弃、新增请求或响应

Spider(核心单元)

1.解析Downkoader返回的响应(Response)

2.产生爬取项(scraped item)

3.产生额外的爬取请求

Item Pipelines

1.以流水线方式处理Spider产生的爬取项

2.由一组操作顺序组成,类似流水线,每个操作是一个Item Pipelines
类型

3.可能操作包括:清理、检验和查重爬取项中的HTML数据、将数据存储到数据库


Scrapy常用命令

格式:>scrapy<command>[options][args]

创建一个新工程

scrapy startproject <name> [dir]

创建一个爬虫

scrapy genspider [options] <name> [domain]

获取爬虫配置信息

scrapy settings [options]

运行一个爬虫

scrapy crawl [spider]

列出工程中所有爬虫

scrapy list

启动URL调试命令行

scrapy shell [url]


Scrapy初探

1.创建一个工程

scrapy startproject name                 (name:工程名字)

2.在工程中产生一个scrapy爬虫

scrapy genspider demo name.io       (demo:主要编辑python文件的名字)

3.配置产生的spider爬虫

   找到上边创建的demo.py的文件,打开,配置

4.运行爬虫,获取网页

scrapy crawl demo                             (demo:主要编辑python文件的名字)               



Scrapy使用步骤:(未完待续)

1.创建一个工程和spider模版

2.编写spider

3.编写item pipeline

4.优化配置策略

相关文章

  • 2021-07-21

    Scrapy框架的基本使用 scrapy框架简介 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构...

  • scrapy框架基本使用

    scrapy基本介绍 scrapy VS requests Mac安装 conda install scrapy ...

  • Scrapy框架的基本使用

    1:什么是Scrapy框架 Scrapy一个开源和协作的框架是基于twisted框架开发而来,twisted是一个...

  • scrapy框架的基本使用

    通过本文了解scrapy的基本使用,并通过一个demo感受它的强大。 scrapy 来自Scrapy官网的介绍: ...

  • scrapy框架的基本使用

    基础使用 相关命令都是在命令行执行1.创建项目:scrapy startproject 项目名称 例:scrapy...

  • 09-Scrapy基础

    一. Scrapy 框架介绍 Scrapy架构图 安装Scrapy 二. 使用Scrapy 使用爬虫可以遵循以下步...

  • python爬虫框架:Scrapy框架基本使用

    1.分析页面确定爬取思路 我们要抓取的页面很简单如下所示: 首先页面没有使用任何的动态加载的技术,我们能够使用正则...

  • 【scrapy框架使用】scrapy框架使用

    [TOC]参考文档:scrapy的使用 :http://python.jobbole.com/86405/pyc的...

  • python网络爬虫笔记三

    一、Scrapy爬虫框架常用命令 二、scrapy使用 scrapy startproject demo 新建...

  • python爬虫框架scrapy

    爬虫框架Scrapy(四) 使用框架Scrapy开发一个爬虫只需要四步:创建项目:scrapy startproj...

网友评论

      本文标题:scrapy框架基本使用

      本文链接:https://www.haomeiwen.com/subject/yxsrlttx.html