前嗅ForeSpider脚本教程-数据抽取脚本实战教程

作者: 前嗅大数据 | 来源:发表于2019-04-17 09:19 被阅读0次

今天，小编给大家带来的教程为：前嗅ForeSpider脚本教程-数据抽取脚本实战教程的，应用场景，数据在源码的html标签里写脚本。具体内容如下：

一.应用场景

当所需要的数据字段大部分需要配置脚本时，可将所有字段的抽取统一放在数据抽取脚本中。

可能用到的类：DOM、EXTRACT。

配置方法：选中数据抽取，点击“脚本窗口”，点击创建按钮。即可在新建的代码框内输入代码。

二.数据在源码的html标签里写脚本

目标数据可在源码中查找到。在目标网页右键，选择“查看源代码”，键盘点击“ctrl+F”，查找目标数据所在位置。

1.数据需要循环

场景：目标数据集中分布，如评论数据。

2.数据不循环

场景：目标数据分散分布。

示例：获取聚美优品网，关键词搜索之后的列表页的页数。

查看源码，得知在源码中的位置。

由图可知，页码所在<div>的class属性值唯一，所以可以根据class属性值找到该<div>。

脚本实例：

var div = DOM.FindClass(“head_pageInfo”); //获取目标数据节点位置

var num=DOM.GetTextAll(div).Middle("/",页).ToInt(); //获取目标数据，并转为int型

网友评论

本文标题：前嗅ForeSpider脚本教程-数据抽取脚本实战教程

本文链接：https://www.haomeiwen.com/subject/kmqgwqtx.html

前嗅ForeSpider脚本教程-数据抽取脚本实战教程