2.1 文本选择器（Text seclector）--websc

2.1 文本选择器（Text seclector）--websc

作者: niujw | 来源:发表于2019-12-02 14:42 被阅读0次

2.1 文本选择器（Text seclector）--websc
jquery选择器大全（2）
2.2 链接选择器（Link seclector）--websc
web学习:04-CSS3文本与字体
jQuery选择器（下）
JQuery
UI元素状态伪类选择器
CSS-曹老师视频笔记-2018.07.10
9.jQuery选择器之表单选择器
常见的MIME类型

例子：B站新番榜单

B站新番榜单

还记得我们在前面小节中总结的使用步骤吗？核心点是选对selector

步骤

1 打开插件

2 创建sitemap

3 选择合适的选择器（selector）

4 爬取数据

5 下载CSV数据

详解

1 打开软件

window10系统, linux系统: 点击Ctrl+Shift+I或点击f12,
mac机 Cmd+Opt+I
鼠标右键=>检查

2 创建sitemap

Sitemap name工程名
Start url可从浏览器中直接复制过来
点击创建

2

3 选择合适的选择器（selector）

创建完成后点击 add new selector
增加selector
选择selector
1：填写selector的名称
2：因为要抓取的是文本数据所以选择Text选择器
3: 点击select然后选中 4，5的文本，然后你发现下面的文本也被自动选中了点击 6 Done selecting! 我们就选中了我们所需要的数据区域
7: 选中Muliple 因为我们需要是多条数据，如果不选仅仅只有一行数据
8: 选中我们的父级selector，_root 是sitemap建立后初始化的根selector，我们创建的选择器都是在_root下的子选择器
9: 保存
3

4 抓取数据

在我们的sitemap下有了刚刚保存的selector记录，你可以尝试着点击一下 Actions底下的几个按钮：
Element preview: 可以查看我们当前选中的数据元素
Data preview：预览我们当前选中的数据
Edit：编辑这条selector
Delete：删除这条selector

4-1

点击4-1图中的选项scrape，然后跳至4-2图中
Request Interval(ms):请求间隔默认2000ms
Page load delay(ms): 页面翻页延迟默认2000ms
这两个选项主要是在抓取数据过程中防止因为网络延迟网页没有刷新成功或数据没有完全加载出来而设置的。默认2000ms，不用修改，接下来点击start scraping
4-2
等待数据抓取完毕，点击页面refrash数据

4-3

4-4

5 下载数据

爬取完毕后点击Export data as CSV 然后点击download now! 然后数据就被我们下载下来了
5-1
附下载后的数据格式，发现了吗?数据顺序并不和网页上的顺序一致（后续会有介绍）

5-2

问题解释

为什么选中前两条标题数据其他的数据也自动被选择上了？
答：因为在html页面在编写过程中这些数据标题的有一定的共性格式，通过a.title这个前端css属性就可以定位到这些数据内容。所以其他的数据也会被选择上。
为什么我的文本数据没有被选择上？
答：首先检查一下你的selector type 是不是选择的text, 其次你在选择数据时的选择位置不对或者错位，多尝试几次就能选中要爬取的数据内容。

遗留问题

1：为什么这些数据展示出来的顺序不一致？
2：如何采集多个数据字段展示？
接下来我们会接着探讨~~

相关文章

2.1 文本选择器（Text seclector）--websc
例子：B站新番榜单还记得我们在前面小节中总结的使用步骤吗？核心点是选对selector 步骤 1 打开插件 2 ...
jquery选择器大全（2）
书接上回... 2. 内容过滤选择器 ——2.1 :contains(text)（取包含text文本的元素） E...
2.2 链接选择器（Link seclector）--websc
例子：B站新番榜单今天抓取新番榜单的动画名称和动画名称后的链接url 通用步骤 1. 打开插件 2. 创建sit...
web学习:04-CSS3文本与字体
1.文本阴影 1.1text-shadow 阴影文本 1.2 text-outline 2.文本换行 2.1 wo...
jQuery选择器（下）
1). 内容过滤选择器它是对元素和文本内容的操作。 a) “:contains(text)”，选取包含text文...
JQuery
基础语法： $(selector).action() 选择器获取值text() - 设置或返回所选元素的文本内容...
UI元素状态伪类选择器
:focus选择器 :focus选择器被用来指定“表单元素”获得光标焦点时使用的样式，主要在单行文本框text、多...
CSS-曹老师视频笔记-2018.07.10
CSS样式表样式风格标签属性：type="text/css" 标签选择器标签名{ 属性名：属性值}文本属性...
9.jQuery选择器之表单选择器
表单选择器 1). 表单 2). 表单对象属性 // 1. 选择不可用的文本输入框 $(":text:disa...
常见的MIME类型
超文本标记语言文本 .html,.html text/html普通文本 .txt text/plainRTF文本 ...

网友评论

本文标题：2.1 文本选择器（Text seclector）--websc

本文链接：https://www.haomeiwen.com/subject/kntiwctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2.1 文本选择器（Text seclector）--websc|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！