本文主要介绍神箭手“微信文章采集爬虫[按公众号或关键字]”(以下简称“微信文章爬虫”)的使用教程以及注意事项。
由于微信公众号上有许多非常棒的文章,具有很高的应用价值,所以神箭手推出了“微信文章爬虫”供各位使用。
接下来,给你详细说明用神箭手“微信文章爬虫”采集并导出数据的步骤:
步骤1 注册并登录
注册并登录神箭手,进入神箭手控制台。
注意:
神箭手支持使用QQ和GitHub账号登陆。
步骤2 购买爬虫
进入神箭手大数据市场,找到“微信文章爬虫”,点击“获取爬虫”按钮,便可成功获取到微信爬虫了。
注意:
要正常使用微信爬虫需要神箭手套餐为“企业标准版”及以上,点此升级神箭手套餐。
步骤3 设置爬虫
进入“微信文章爬虫”总览页,点击“爬虫设置”,您可以选择将文件托管方式,设置微信文章的爬取方式,以及是否使用神箭手提供的免费“验证码识别”功能,设置后别忘了点“保存”。
注意:
1. 如果想提高爬虫的爬取速率,建议勾选“只打印关键日志”;
2. 爬虫支持“按关键字、公众号ID或公众号名称”爬取微信文章,可根据实际情况自由选择;
3. 神箭手自行研发的人工智能验证码识别是完全免费的,识别成功率较高。
步骤4 爬取数据
再次进入“微信文章爬虫”总览页,点击“启动爬虫”,爬虫变开始爬取微信文章了,稍等片刻,便可在“爬取结果”页查看爬取的文章数据了。
步骤5 数据发布与导出
当爬虫爬到数据后,你可以选择将数据发布到网站或数据库中,点此查看神箭手数据发布详细教程。
此外,还可选择将数据“导出”,点此查看神箭手数据导出详细教程。
“微信文章爬虫”导出数据示例,如下图所示:
神箭手大数据市场“微信文章爬虫[按公众号或关键字]”购买地址:http://www.shenjian.io/index.php?r=market/product&product_id=500085
网友评论