Scrapy同时启动多个爬虫

作者: 宇宙有只AGI | 来源:发表于2019-04-26 11:56 被阅读0次

Scrapy同时启动多个爬虫
Scrapy同时启动多个爬虫
scrapy中同时启动多个爬虫
Scrapy笔记
爬虫框架常见命令（善忘者）
设置pycharm调试scrapy框架爬虫
scrapy同时运行多个爬虫
如何获取指定模块下所有的类
小爬虫实践项目-爬取伯乐在线全部文章信息
1.关于scrapy的爬虫名name

一、方法

1、通过CrawlerProcess

"""

from scrapy.crawlerimport CrawlerProcess

from scrapy.utils.projectimport get_project_settings

def run_process_spiders(spider_list=None):

process = CrawlerProcess(get_project_settings())

for spider in spider_list:

process.crawl(spider)

process.start()

"""

二、参考资料

1、在同一个进程中运行多个蜘蛛（官方，使用中）

https://docs.scrapy.org/en/latest/topics/practices.html#run-from-script

2、scrapy启动多爬虫（简书，测试可用）

https://www.jianshu.com/p/03a68cbacf92

三、思考

1、不使用scrapy-redis的原因

a. 启动后好像是按顺序执行的（即一个个执行爬虫，速度变慢）

b. redis内存吃不消（两个就满了）

c. 服务器重启后等一些意外情况，会导致redis重启，保存的request指纹丢失

d. 即便指纹不丢失，也可能会出现数据丢失的情况

网友评论

本文标题：Scrapy同时启动多个爬虫

本文链接：https://www.haomeiwen.com/subject/oujfnqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Scrapy同时启动多个爬虫

一、方法

1、通过CrawlerProcess

二、参考资料

三、思考

1、不使用scrapy-redis的原因

相关文章

Scrapy同时启动多个爬虫

Scrapy同时启动多个爬虫

scrapy中同时启动多个爬虫

Scrapy笔记

爬虫框架常见命令（善忘者）

设置pycharm调试scrapy框架爬虫

scrapy同时运行多个爬虫

如何获取指定模块下所有的类

小爬虫实践项目-爬取伯乐在线全部文章信息

1.关于scrapy的爬虫名name

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读