DatistEQ之批量抽取仪器状态数据

作者: 了无_数据科学 | 来源:发表于2021-01-19 14:43 被阅读0次

生产过程中,加班整理Excel报表是一种常见工作状态。从大量的报表中的抽取数据,是“表哥表姐”的基本技能。DatistEQ中,智能解析节点,就是为了应对这种场景而产生的。

下面以“仪器运行状态”报表汇总实例,来给大家介绍,智能解析节点的使用过程。

1、数据现状与目标要求

每天一张Excel表单,记录着各个台站的运行情况。每个表单的内容格式基本相同。需要从这些表单中将数据抽取出来的,合并到一个流程中,以便于后续应用。


数据现状

2、从数据源工具栏中,将智能解析节点加入到流程编辑区。


智能解析节点

3、双击打开智能解析节点编辑器,单击设计取值模板按钮,打开解析模板设计器。


智能解析节点编辑器

4、打开Excel文件。单击打开按钮,在文件打开对话框中,选取待解析的Excel文件。


解析模板设计器

5、定义数据读取工程。单出新建按钮,新建一个数据读取工程。


数据读取模板

6、定义字段。在数据浏览区,选取字段的标题栏,单击定义字段按钮,在弹出的指定字段定义方式对话框中,指定选中区块,生成字段名称的方式。


定义字段名称

7、修改字段类型。在右侧的模板定义区,切换至字段窗口,单出Fields的内容编辑按钮,打开TbField集合编辑器,查看并修改字段名及数据类型。


字段名称

8、定义内容块。在数据浏览区,选中字段标题区块,单击添加内容块按钮。在模板窗口属性内容块栏中,单击Items内容编辑按钮,打开ColumnCell集合编辑器,查看并修改表格内容对应的字段名,建立表单内容与字段名之间的对应关系。


内容块

9、模板有效性验证。单击验证报表,系统将对模板的有效性进行验证。在弹出运行报告窗口中,给了模板的检查结果。Preview窗口中,给出了当前表单的解析结果。


模板有效性验证

10、解析结果。关闭解析模板设计器,回到智能解析节点编辑器,勾选所有表单。运行智能解析节点,即可从所有表单中抽取数据。从每个表中获取的数据量,如右图所示。


解析结果

通过仪器运行状态报表数据批理抽取的案例,给大家简单演示了,Excel智能解析节点的读取模板定义、字段定义、内容块等过程,从而自动从23个表单中,快速抽取出各个台站的单月的运行状态数据。

Excel智能解析节点,提供一种快速抽取数据的方案,本例中仅是其强大功能牛小试,后续的文章,我们将陆续为大家揭示数据漂移、模糊匹配等强大的功能。

相关文章

  • DatistEQ之智能解析的三种取值方式

    在文章《DatistEQ之批量抽取仪器状态数据》[https://www.jianshu.com/p/028248...

  • DatistEQ之拆分仪器状态数据

    在前文《DatistEQ之批量抽取仪器状态数据[https://www.jianshu.com/p/028248e...

  • DatistEQ之批量抽取仪器状态数据

    生产过程中,加班整理Excel报表是一种常见工作状态。从大量的报表中的抽取数据,是“表哥表姐”的基本技能。Dati...

  • DatistEQ之Word内容抽取

    百度百科:调查表就是运用科学的方法系统地搜集、记录、整理和分析有关市场的信息资料,从而了解市场发展变化的现状和趋势...

  • DatistEQ之抽取文本内容

    V 2022 Q2版 数据处理过程中,时常会遇到从字符串中提取特定内容的场景,如从FTP的连接串中,抽取用户名。 ...

  • DatistEQ之数据流

    何为数据流、什么是文件流呢?一个非常基本命题,始终没有一个明确的概念。 一、数据流 数据流(data stream...

  • 前嗅ForeSpider脚本教程:数据抽取脚本

    数据抽取脚本与数据过滤并列的脚本,它的作用是对抽取的数据进行过滤。数据处理脚本是数据抽取中的脚本。点击“数据抽取”...

  • 从mysql抽取数据传入redis

    场景 有一点需要说明,虽然文章题目是:从mysql抽取数据传入redis,但是内容绝不仅限于此 需要将大批量数据快...

  • 爬虫脚本--pdf处理思路

    pdf处理思路 1 抽取文本数据 2 抽取图片数据 3 抽取表格数据 ==》 人名 地名 年代 ==》 行业 ...

  • DatistEQ之网页数据收集

    网页抓取(又称为网络数据提取、网页爬取)是一种从网页上获取页面内容的计算机软件技术。它是一种数据复制过程,其中从网...

网友评论

    本文标题:DatistEQ之批量抽取仪器状态数据

    本文链接:https://www.haomeiwen.com/subject/aebqzktx.html