美文网首页
2018-09-05 scrapy-spider(一)

2018-09-05 scrapy-spider(一)

作者: 认真的史莱冰 | 来源:发表于2018-09-06 16:31 被阅读0次

    介绍scrapy发出请求,并且处理数据的文件 spider.

    首先介绍命令 scrapy genspider -l

    这个命令可以显示出当前可用的spider模板

    这里有四个模板常用模板是 basic 和 crawl(也不是常用,目前我只用过这两个模板)

    basic模板就是很普通很基础的模板,但是可以用来爬去用ajax渲染数据的网站(比如拉勾网),crawl更偏向于有规则的数据,面对有规律的网站可以很轻松的做到全站爬去。

    如果想创建spider文件,就进入项目中的spider目录(用cmd进入),输入命令 scrapy genspider -t 模板名(比如crawl) 爬虫名 域名

    这样就能创建好一个爬虫软件

相关文章

  • 2018-09-05 scrapy-spider(一)

    介绍scrapy发出请求,并且处理数据的文件 spider. 首先介绍命令 scrapy genspide...

  • 2018-09-05 scrapy-spider(二)

    开始介绍crawl模块 该模块用于爬去有规律的网站贼好用。比如(知乎,51job,智联招聘等) scrap...

  • 2018-09-05 scrapy-spider(二)

    下面介绍basic,如果使用这个模板可以直接在spider子目录下创建文件(因为要写的东西不多) 这是用 sc...

  • 2018-09-05

    戴师傅 2018-09-05 2018-09-05 20:32 打开App (稻盛哲学学习会)打卡第127天 姓名...

  • 2018-09-04

    2018-09-05 12:53 跳操30分钟

  • 亲子日记(41)-舞

    2018-09-05 星期三 晴 少年舞 一 秋阳斜依,霞光掩映, 悠悠...

  • 佛法无边

    吴青青 2018-09-05 阅读 383 (一) 苍苍人世,四大皆空。 人生赤...

  • 望书中樵夫不吝赐教

    钗头凤 泪雨 书中樵夫 关注 2018-09-05 06:45 · 字数 85 · 阅读 402 · 樵夫诗词集 ...

  • 赛诗会

    钗头凤 泪雨 书中樵夫 关注 2018-09-05 06:45 · 字数 85 · 阅读 402 · 樵夫诗词集 ...

  • 赛诗会

    钗头凤 泪雨 书中樵夫 关注 2018-09-05 06:45 · 字数 85 · 阅读 402 · 樵夫诗词集 ...

网友评论

      本文标题:2018-09-05 scrapy-spider(一)

      本文链接:https://www.haomeiwen.com/subject/wvtzwftx.html