美文网首页
赶集网商铺信息采集

赶集网商铺信息采集

作者: 八爪鱼采集器 | 来源:发表于2017-08-22 14:37 被阅读0次

    本文介绍使用八爪鱼采集赶集网数据(以南山商铺信息为例)的方法

    采集网站:http://sz.ganji.com/fang6/nanshan/

    示例规则下载

    使用功能点:

    分页列表及详细信息提取

    步骤1:创建采集任务

    1)进入主界面,选择“自定义模式”

    2)将商铺信息页的网址复制粘贴到网站输入框中,点击“保存网址”

    步骤2:创建翻页循环

    1)将页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”

    步骤3:创建列表循环

    1)移动鼠标,选中页面里的第一个商铺链接。选中后,系统会自动识别页面里的其他相似链接。在右侧操作提示框中,选择“选中全部”

    步骤4:提取商铺信息

    1)在创建列表循环后,系统会自动点击第一个商铺链接,进入商铺详细信息页。点击需要的字段信息,在右侧的操作提示框中,选择“采集该元素的文本”

    2)字段信息选择完成后,选中相应的字段,可以进行字段的自定义命名。完成后,点击左上角的“保存并启动”,启动采集任务

    3)选择“启动本地采集”

    步骤5:数据采集及导出

    1)采集完成后,会跳出提示,选择“导出数据”

    2)选择“合适的导出方式”,将采集好的商铺信息数据导出

    3)这里我们选择excel作为导出为格式,数据导出后如下图

    相关文章

      网友评论

          本文标题:赶集网商铺信息采集

          本文链接:https://www.haomeiwen.com/subject/xdkldxtx.html