美文网首页
2018-09-05 scrapy-spider(一)

2018-09-05 scrapy-spider(一)

作者: 认真的史莱冰 | 来源:发表于2018-09-06 16:31 被阅读0次

        介绍scrapy发出请求,并且处理数据的文件 spider.

        首先介绍命令 scrapy genspider -l

        这个命令可以显示出当前可用的spider模板

        这里有四个模板常用模板是 basic 和 crawl(也不是常用,目前我只用过这两个模板)

        basic模板就是很普通很基础的模板,但是可以用来爬去用ajax渲染数据的网站(比如拉勾网),crawl更偏向于有规则的数据,面对有规律的网站可以很轻松的做到全站爬去。

        如果想创建spider文件,就进入项目中的spider目录(用cmd进入),输入命令 scrapy genspider -t 模板名(比如crawl) 爬虫名 域名

        这样就能创建好一个爬虫软件

    相关文章

      网友评论

          本文标题:2018-09-05 scrapy-spider(一)

          本文链接:https://www.haomeiwen.com/subject/wvtzwftx.html