美文网首页
scrapy信号signals

scrapy信号signals

作者: zenos876 | 来源:发表于2019-08-14 10:56 被阅读0次

Scrapy广泛使用信号来通知特定事件发生的时间。 可以在Scrapy项目中捕获一些这些信号(例如,使用扩展名)来执行其他任务或扩展Scrapy的功能。

现在数据收集的基础上, 当检测到关闭的信号, 将对收集的404url拼接插入到的stats

简单的例子

1.在spider中导入库

from scrapy.xlib.pydispatch import dispatcher
from scrapy import signals

2.定义spider关闭时需要处理的方法

    def handle_spider_closed(self, spider, reason):
        self.crawler.stats.set_value('failed_urls', ','.join(self.failed_urls))
        pass

由于信号signals.spider_closed传递了两个参数, 这里定义的方法接收了这两个参数


spdier_closed

3.在初始化中与信号连接

    def __init__(self, **kwargs):
        super().__init__(**kwargs)
        self.failed_urls = []
        dispatcher.connect(self.handle_spider_closed, signals.spider_closed)

4.运行结果

运行结果

scrapy官方文档

相关文章

  • scrapy信号signals

    Scrapy广泛使用信号来通知特定事件发生的时间。 可以在Scrapy项目中捕获一些这些信号(例如,使用扩展名)来...

  • scrapy信号(Signals)和数据收集(Stats Col

    信号(Signals) 记录运行时间主要用的的就是scrapy的singal信号管理,点击查看详情 根据各种信号记...

  • Flask Signals详解

    Flask Signals简介 Flask Signals和操作系统的signals系统很类似,都是通过信号(也可...

  • iOS崩溃类型

    奔溃类型:·Mach kernel exceptions //内核异常· Fatal signals //信号 ...

  • ReactiveCocoa 4 图解之六——信号发生器(Sign

    一个信号发生器,由SignalProducer类型表示,可以创建信号(signals)并施加副作用(side ef...

  • 【nignx】nginx reload了,连接怎么办?

    谈谈 nginx 信号集http://io.upyun.com/2017/08/19/nginx-signals[...

  • cautious

    场景:看到这样的信号一定要小心。 造句:Be cautious when you see such signals.

  • scrapy 爬虫

    scrapy 官方文档 scrapy的信号量文档使用 scrapy的扩展文档使用 scrapy统计数据收集 安装:...

  • pyqt5——事件和信号

    事件和信号 事件 signals and slots 被其他人翻译成信号和槽机制,(⊙o⊙)…我这里还是不翻译好了...

  • 进程通信之信号 (Signals)

    先备知识:fork()系统调用、wait()系统调用 信号是软件生成的中断,比如用户按下 Ctrl-C 或一个进程...

网友评论

      本文标题:scrapy信号signals

      本文链接:https://www.haomeiwen.com/subject/dwwwjctx.html