美文网首页
scrapy -1.总序

scrapy -1.总序

作者: ddm2014 | 来源:发表于2018-06-17 10:29 被阅读0次

scrapy是基于异步的爬虫,适用于多网页的爬取。主要有几个重要组件,一个是spider,具体的分析爬取信息,一个是items,存储爬取下来的信息,一个是pipeline,把item储存的信息清洗,存到数据库,最后一个是settings,用于控制整个爬虫组件。
安装:
用anaconda装,方便快捷。在anaconda里用pip install scrapy就好了

生成一个scarpy项目,转到需要的文件下
scrapy startproject 项目名称
就会在该文件夹下生成相关文件。

image.png

接下来需要做的就是前面说的填充几个组件。
其中spider需要自己创建一个.py的文件。
items、pipelines、settings都已经有了模板文件,只需要在此基础上做相应更改即可。

相关文章

  • scrapy -1.总序

    scrapy是基于异步的爬虫,适用于多网页的爬取。主要有几个重要组件,一个是spider,具体的分析爬取信息,一个...

  • DG风云之路总 -- 1.序

    高空,云层上一架波音客机呼啸而过,只见白色的机身上几个中文特别显眼:路总专机。机舱里,靠窗的真皮沙发上,一个...

  • Scrapy安装

    1.安装scrapy使用anaconda安装Scrapy特别方便。conda install scrapy ,输...

  • scrapy + mongodb +redis 实现爬虫

    1. 安装scrapy pip install scrapy 安装scrapy-redis pip inst...

  • 通过核心API启动单个或多个scrapy爬虫

    1. 可以使用API从脚本运行Scrapy,而不是运行Scrapy的典型方法scrapy crawl;Scrapy...

  • 总序

    我之所以决定写这么一些东西,并不仅仅是为了某一刻突然的兴趣,也不是为了刻意去描写某一人,某一事。 归根究底,单纯是...

  • 总序

    近来看了《假如给我三天光明》颇有感触,于是遂有私心写一本自己眼睛所见与所想的书,每篇字数不限。然后于是有了以下的物...

  • 总序

    最近,连续看了很多很多电影,音乐会,舞蹈剧反正好多表演。总结一下把,不然真的,有些东西我觉得没有记录可能就真不好说...

  • 总序

    认识我的人都知道,我非常热爱体育运动,专门开了一个文集来写对我影响最大的运动——跑步。而这个文集比较杂乱,记录的...

  • 序(总)

    文|桃源敏(袁敏) 此书可以帮助您彻底的摆脱人生的困惑迷茫、内心的浮躁不安、身心的疲倦懈怠、效率的低迷原始。这是一...

网友评论

      本文标题:scrapy -1.总序

      本文链接:https://www.haomeiwen.com/subject/wcnieftx.html