美文网首页
爬虫项目的部署

爬虫项目的部署

作者: YANG_c08b | 来源:发表于2018-12-13 20:52 被阅读0次

1.scrapyd是运行scrapy爬虫的服务程序,它支持以http命令方式发布、删除、启动、停止爬虫程序。而且scrapyd可以同时管理多个爬虫,每个爬虫还可以有多个版本

pip3 install scrapyd

2.scrapyd-client发布爬虫需要使用另一个专用工具,就是将代码打包为EGG文件,其次需要将EGG文件上传到远程主机上这些操作需要scrapyd-client来帮助我们完成

pip3 install scrapyd-client

3.修改scrapy项目目录下的scrapy.cfg配置文件

首先需要修改scrapyd.egg (项目的配置文件)

[deploy]

url=http://localhost:6800

project=项目名称

4.修改完成后即可开始部署共作
本地部署 项目部署相关命令: 注意这里是项目的名称而不是工程的名称

scrapyd-deploy -p <项目名称>

也可以指定版本号
scrapyd-deploy -p <项目名称> --version <版本号>

5.运行爬虫
curl http://localhost:6800/schedule.json -d project=myproject -d spider=somespider

6.关闭爬虫

curl http://localhost:6800/cancel.json -d project=myproject -d job='jobid'

7.获取部署的爬虫项目列表

curl http://localhost:6800/listprojects.json

8.获取项目下的爬虫文件列表

curl http://localhost:6800/listspiders.json?project=myproject

9.获取工程下的爬虫运行状态
curl http://localhost:6800/listjobs.json?project=myproject

10.删除部署的爬虫项目
curl http://localhost:6800/delproject.json -d project=myproject

相关文章

  • 爬虫项目的部署

    1.scrapyd是运行scrapy爬虫的服务程序,它支持以http命令方式发布、删除、启动、停止爬虫程序。而且s...

  • scrapy + scrapyd 部署使用

    scrapyd 部署 注:example 为项目名称 安装 启动 scrapyd 部署 爬虫 添加爬虫 取消爬虫 ...

  • scrapyd和scrapyd-client使用教程

    scrapyd是一个用于部署和运行scrapy爬虫的程序,它允许你通过JSONAPI来部署爬虫项目和控制爬虫运行 ...

  • 爬虫

    框架选择分布式scrapy 通过Scrapyd 部署和运行整个爬虫项目,而项目的管理则可以使用Gerapy 代理池...

  • Linux 下部署Tomcat

    学习一项技能,需要有一个有目的性任务,学得才会快; 目的:部署一个网站; 参考文档:参考文档 一、资料显示,部署t...

  • Celery部署爬虫(三)

    今天就来点比较有意思的东西 面前两篇Celery部署爬虫(一) Celery部署爬虫(二) 充其量就是 Celer...

  • 爬虫练习2

    主要练习目标:数据的获取、反反爬虫部署、数据识别、数据解析、数据读取输出深层目标:优化反反爬虫部署、增加判断浏览器...

  • Scrapyd部署爬虫干货

    使用Scrapyd部署爬虫 为什么要用Scrapyd? Scrapyd是scrapinghub官方提供的爬虫管理、...

  • scrapyd+gerapy部署分布式爬虫及scrapyd-de

    今天尝试在windows中使用scrapyd+gerapy部署爬虫 首先需要部署scrapyd完成部署 先安装以下...

  • Scrapyd部署爬虫

    Scrapyd部署爬虫 Python 如何将字符串转为字典 Facebook 爬虫 Xpath string()提...

网友评论

      本文标题:爬虫项目的部署

      本文链接:https://www.haomeiwen.com/subject/rlqihqtx.html