美文网首页
Scrapy相关

Scrapy相关

作者: ckawyh | 来源:发表于2018-07-02 19:59 被阅读0次

输出日志文件,Settings配置:

LOG_FILE = 'DEBUG_%s.txt' % (datetime.now().strftime('%Y%m%d_%H%M_%S'))

定时任务调度:

# -*- coding: utf-8 -*- 
# @Description  : 调度程序,每天执行一次

import os
import datetime
from apscheduler.schedulers.blocking import BlockingScheduler


def job_yingyongbao():
    print('Start job yingyongbao ', datetime.datetime.now())
    os.system('scrapy crawl yingyongbao_spider')


def job_wandoujia():
    print('Start job wandoujia ', datetime.datetime.now())
    os.system('scrapy crawl wandoujia_spider')


if __name__ == '__main__':
    scheduler = BlockingScheduler()

    job1_time = datetime.datetime.now() + datetime.timedelta(seconds=5)
    job2_time = job1_time + datetime.timedelta(seconds=10)
    scheduler.add_job(job_yingyongbao, 'interval', start_date=job1_time, hours=24)
    scheduler.add_job(job_wandoujia, 'interval', start_date=job2_time, hours=24)

    scheduler.start()

相关文章

  • CSDN热榜、华为云博客都可用来练习Python scrapy

    这篇博客补充一下 scrapy 选择器相关知识。 scrapy 选择器 scrapy 框架自带数据提取机制,相关内...

  • Scrapy相关

    输出日志文件,Settings配置: 定时任务调度:

  • scrapy 相关

    好久没有用过scrapy框架,甚至有一些手生了。学习东西最痛苦的事情是,学了的东西不用。过一段时间我都怀疑自己是否...

  • scrapy相关

    学习资料 书籍: Python爬虫开发与项目实战该书作者博客:http://www.jianshu.com/u/c...

  • [工具&笔记]scrapy相关和docker部分

    示例:architecture_spider Scrapy 相关 参考scrapy文档,scrapyd文档 scr...

  • 避免重复访问

    scrapy默认使用 scrapy.dupefilter.RFPDupeFilter 进行去重,相关配置有:

  • scrapy相关专题总结

    本月的scrapy已经写完,关于scrapy写了常用的中间件、数据管道、以及scrapy的相关源码,但是感觉可写的...

  • Scrapy学习篇(二)之命令行工具

    简介 Scrapy是通过Scrapy命令行工具进行控制的,包括创建新的项目,爬虫的启动,相关的设置,Scrapy提...

  • 关于Scrapy与callback

    这几天为了面试的事情,看个很多关于Scrapy以及周边的相关技术的文章和代码,相关的整理如下: Scrapy爬取很...

  • scrapy-redis 爬取京东

    在之前,对于scrapy 框架进行了相关的学习,本篇承接上一篇爬虫的内容,进行相关的实践,利用scrapy_red...

网友评论

      本文标题:Scrapy相关

      本文链接:https://www.haomeiwen.com/subject/dcxruftx.html