对于刚接触神箭手的童鞋,在使用神箭手大数据市场提供的爬虫时,往往会忽略一些爬虫的配置细节,本文属于扫盲帖,老虾米请绕道~~
首先,你得注册一个神箭手账号,然后登陆到你的神箭手控制台,开图,不做赘述。

其次,你需要在“神箭手大数据市场 ”输入“淘宝”,找到“淘宝商品信息采集爬虫 ”并获取爬虫。进入爬虫总览页,切记,不要急于启动爬虫,你需要先配置爬虫。

在“爬虫设置”页面,先对日志进行设置,勾选“只打印关键日志”可以提高不少爬虫的爬取速率。

然后,选择你爬取方式(按关键字,按店铺)。关键字可以输入多个,也可输入包含关键字的链接,批量操作;店铺url的输入同理。之后,选择需爬取的字段,保存即可启动爬虫爬取数据了。
按关键字爬取商品时,可选字段如下:

按店铺爬取商品时,可选字段如下:

童鞋们,看完是不是有恍然大悟的赶脚~~~
网友评论