RuiJi Scraper快速上手

RuiJi Scraper快速上手

作者: 清风_扰梦 | 来源:发表于2018-11-07 22:05 被阅读0次

RuiJi Scraper快速上手
RuiJi Scraper 分页抽取
RuiJi Scraper基础 – RuiJi表达式模型
RuiJi Scraper 网页视觉识别
RuiJi Scraper 选择器函数
爬虫—Web Scraper（一）
使用RuiJi Scraper将文章导入WordPress
Masonry介绍与使用实践：快速上手Autolayout
Spring Boot-web开发详解
快速上手

RuiJi Scraper网络数据提取工具支持目前大部分主流浏览器。

例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器、猎豹浏览器、百度浏览器、360极速浏览器，以及火狐浏览器、微软最新的Edge浏览器。

因为谷歌浏览器应用商店在国内有墙的限制，今天我们就使用火狐浏览器为大家演示如何快速上手RuiJi Scraper来采集数据。

1.打开火狐浏览器附加组件管理器，搜索RuiJi Scraper并安装。

2.登录RuiJi Scraper，如果没有账号可以用邮箱注册（注册直接送7天会员哦，如果有推荐码还额外赠送7天）。

3.打开想要提取的界面，点击RuiJi按钮打开提取面板。

4.我们首先能看到公共规则面板，点击大拇指可以点赞，点击五角星可以收藏。点开收藏面板，可以看到我们刚刚收藏的规则。

5.点击查看按钮，可以按照当前规则进行查看能选中哪些元素。

6.点击抽取按钮，进行实际抽取，抽取后可进入工作簿查看抽取的内容。我们可以看到RuiJi Scraper将所有图片的描述信息和地址提取出来了。

7.打开工作簿可以选择导出自己想要的格式化文件，我们以csv格式的excel表格为例。检测地址可以检测出可以下载的页面、图片、视频、音频等进行打包下载。

8.可以通过点击公共规则的编辑按钮或者右上角的+按钮进入，创建私有规则的界面。

9.编辑私有规则，首先为规则添加一个名称，指定通配符（标识这个规则适用于哪些地址，*代表多个任意字符，?代表一个任意字符），指定域。

10.选定一个块选区域，指定需要提取网页哪个部分的信息，填写可增加精确度。（可忽略）

11.选定一个片选区域，需要提取哪些重复片中的信息。

12.首先我们提取一个商品名称，指定好要提取的标签元素特征，再指定提取元素下的text文本即可。

13.我们再来提取链接，方法同上，但是链接一般都在a标签中，所以为了精确性需要2步执行。

14.再来提取店名，方法同商品名称。

15.最后我们提取价格，同样为了准确性我们需要两步来筛选，去掉人民币符号。还要注意我们提取的价格是浮点小数，所以将提取结果指定为double，而不是字符串的str。编辑后保存。

16.使用我的规则进行抽取，抽取结果在工作簿查看。（还可看到之前公共规则测试提取的所有图片）

17.按价格排序，然后导出数据。

以上就是快速上手RuiJi Scraper网页信息提取工具的方法，详细深入使用可参考其他文章。如实在有不明白的或者有建议，请发邮件至lixiang@ruijihg.com邮箱中，一定及时回复。希望得到大家的支持，我们会越做越好。

相关文章

RuiJi Scraper快速上手
RuiJi Scraper网络数据提取工具支持目前大部分主流浏览器。例如以谷歌为内核开发的谷歌浏览器、腾讯浏览器...
RuiJi Scraper 分页抽取
如果想抽取分页结，您需要在规则配置中配置分页选择器，分页选择器位于规则编辑器最下方，如图所示请注意以下分页选择器...
RuiJi Scraper基础 – RuiJi表达式模型
前言 RuiJi Scraper是一款可视化的浏览器爬虫扩展，是一款适合金融、新闻编辑、新媒体人员、个人站点、爬虫...
RuiJi Scraper 网页视觉识别
网页设计师在设计网页的过程中，往往会考虑页面的视觉结构，这使得使用者可以快速分辨出网页不同区域(RuiJiScra...
RuiJi Scraper 选择器函数
选择器函数用于用户调用自定义方法处理抽取结果，我们需要抽取的页面显示的抽取结果，有可能并不是我们想要的最终结果，这...
爬虫—Web Scraper（一）
跟大家分享的是web scraper爬虫工具使用方法。目录 1.Web Scraper插件安装 2.上手体验 3...
使用RuiJi Scraper将文章导入WordPress
WordPress做为个人博客系统，小型企业网站被越来越多的用户使用。个人站长或企业网编在日常编辑中会转发一些精彩...
Masonry介绍与使用实践：快速上手Autolayout
Masonry介绍与使用实践：快速上手Autolayout Masonry介绍与使用实践：快速上手Autolayout
Spring Boot-web开发详解
之前有一篇文章介绍了如何快速上手Spring Boot：如何快速上手Spring Boot？，方便大家快速入门、了...
快速上手
在现今快速发展的时代，无论是工作中还是生活上，经常会遇到新领域，有可能是新学科、新行业、新项目，也可能新部门、新...

网友评论

本文标题：RuiJi Scraper快速上手

本文链接：https://www.haomeiwen.com/subject/rlalxqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|RuiJi Scraper快速上手|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！