美文网首页
10.数据提取

10.数据提取

作者: M_小七 | 来源:发表于2020-07-21 21:29 被阅读0次

数据提取概述

知识点
  • 了解 响应内容的分类
  • 了解 xml和html的区别

1. 响应内容的分类

在发送请求获取响应之后,可能存在多种不同类型的响应内容;而且很多时候,我们只需要响应内容中的一部分数据

  • 结构化的响应内容

    • json字符串

      • 可以使用re、json等模块来提取特定数据
      • json字符串的例子如下图


        结构化响应内容json.png
  • xml字符串

    • 可以使用re、lxml等模块来提取特定数据

    • xml字符串的例子如下

      <bookstore>
      <book category="COOKING">
        <title lang="en">Everyday Italian</title> 
        <author>Giada De Laurentiis</author> 
        <year>2005</year> 
        <price>30.00</price> 
      </book>
      <book category="CHILDREN">
        <title lang="en">Harry Potter</title> 
        <author>J K. Rowling</author> 
        <year>2005</year> 
        <price>29.99</price> 
      </book>
      <book category="WEB">
        <title lang="en">Learning XML</title> 
        <author>Erik T. Ray</author> 
        <year>2003</year> 
        <price>39.95</price> 
      </book>
      </bookstore>
      
  • 非结构化的响应内容

    • html字符串

      • 可以使用re、lxml等模块来提取特定数据
      • html字符串的例子如下图
非结构化响应内容html.png
知识点:了解 响应内容的分类

2. 认识xml以及和html的区别

要搞清楚html和xml的区别,首先需要我们来认识xml

2.1 认识xml

xml是一种可扩展标记语言,样子和html很像,功能更专注于对传输和存储数据

<bookstore>
<book category="COOKING">
  <title lang="en">Everyday Italian</title> 
  <author>Giada De Laurentiis</author> 
  <year>2005</year> 
  <price>30.00</price> 
</book>
<book category="CHILDREN">
  <title lang="en">Harry Potter</title> 
  <author>J K. Rowling</author> 
  <year>2005</year> 
  <price>29.99</price> 
</book>
<book category="WEB">
  <title lang="en">Learning XML</title> 
  <author>Erik T. Ray</author> 
  <year>2003</year> 
  <price>39.95</price> 
</book>
</bookstore>

上面的xml内容可以表示为下面的树结构:

xml树结构.gif

2.2 xml和html的区别

二者区别如下图

xml和html的区别.png
  • html:
    • 超文本标记语言
    • 为了更好的显示数据,侧重点是为了显示
  • xml:
    • 可扩展标记语言
    • 为了传输和存储数据,侧重点是在于数据内容本身

知识点:了解 xml和html的区别

2.3 常用数据解析方法

数据解析.png

相关文章

  • 10.数据提取

    数据提取概述 知识点 了解 响应内容的分类 了解 xml和html的区别 1. 响应内容的分类 在发送请求获取响应...

  • 数据提取之JSON

    数据提取 什么是数据提取? 简单的来说,数据提取就是从响应中获取我们想要的数据的过程 数据分类 非结构化的数据:h...

  • CAD数据提取方法

    CAD数据提取方法 1.工具栏选择“注释”模块——选择“表格”——点击“数据提取”,弹出“数据提取”操作框弹出“数...

  • Genesys接口 - 03 数据提取器 - Data Extr

    Data Extractor - 数据提取器服务 允许客户通过接口,从IC数据库中提取数据,根据现有的配置决定提取...

  • 数据提取

  • 数据采集器浏览器与爬虫

    使用数据提取器从网站中提取数据。数据提取代理是读取和解析目标web页面的web浏览器。Visual Web Rip...

  • tableau数据提取还在使用空提取么?建议换一种方式

    如何高效的完成大批量数据的提取?空提取?当然不是: 首先报一个空提取的坑,之前我遇到数据提取的问题,采用空提取方式...

  • 1.1postman常用函数

    随机数 案例 提取响应数据(提取json格式的数据) 断言响应信息 案例

  • Seurat的subset,数据提取方法

    矩阵数据提取

  • Tableau进阶

    一、应用提取筛选器 数据的提取通过遵循菜单【数据→编辑数据源筛选器】。它创建了许多选项,例如对要提取的行数应用限制...

网友评论

      本文标题:10.数据提取

      本文链接:https://www.haomeiwen.com/subject/bsawkktx.html