美文网首页
结构化数据上的选出运算

结构化数据上的选出运算

作者: 小黄鸭呀 | 来源:发表于2020-11-14 21:17 被阅读0次

 选出是指在集合中,根据指定条件获取成员。选出与定位计算很相似,不过定位关心的是成员在集合中的位置,而选出关心的是成员记录的详细信息。比如选出入职超过 10 年的员工收入,查询销售额超过一万的客户名称等等。如何简单快捷的实现选出?这里将为你全程剖析,并提供 esProc SPL 示例代码。

1. 选出符合条件的成员

【例 1】 分栏列出欧洲和非洲人口超 200 万的城市名称及人口(每栏按从多到少排序)。世界城市人口表部分数据如下:

期望结果如下:

【SPL 脚本】

A4的执行结果如下:

【例 2】 查询纽约研发部门员工的全名和收入。部分数据如下:

【SPL 脚本】

A4的执行结果如下:

【例 3】 查询各部门 30 岁以下和 50 岁以上的员工的人数。部分数据如下:

【SPL 脚本】

A4的执行结果如下:

2. 查找最大值 / 最小值对应记录

【例 4】 根据成绩表,求一班数学成绩最低的学生 ID。部分数据如下:

【SPL 脚本】

最小值所在记录不一定是唯一的,如果想返回所有记录,可以使用函数 A.minp() 的选项 @a :

A3的执行结果如下:

A4的执行结果如下:

【例 5】 根据奥运会奖牌榜统计表,求总成绩蝉联第一名届数最长的国家。部分数据如下:

【SPL 脚本】

A5的执行结果如下:

3. 分区段查找数据

有时候我们需要通过计算数值在区间中的序号,来获取在集合中的对应成员。比如根据考试成绩返回评价(优、良、中、差);根据家庭年收入返回家庭所处的资产等级(贫困、小康、中产、富裕等)。

【例 6】 根据成绩表,统计英语科目优秀、及格和不及格的人数。部分数据如下:

【SPL 脚本】

A4的执行结果如下:

4. 选出前 N 名 / 后 N 名

【例 7】 根据成绩表,求各班各科前两名的学生 ID。部分数据如下:

【SPL 脚本】

A4的执行结果如下:

5. 根据主键值查找对应记录

根据主键值查找对应记录是很常见的操作,例如根据员工 ID 查找员工记录,根据订单 ID 查询订单详细信息等等。

【例 8】 根据相互关联的课程表和选课表,列出所有学生所选课程信息表,每个科目作为一列。课程表部分数据如下:

    选课表部分数据如下:

    希望转换成如下表格:

【SPL 脚本】

A6的执行结果如下:

SPL CookBook》中还有更多相关计算示例。

相关文章

  • 结构化数据上的选出运算

    选出是指在集合中,根据指定条件获取成员。选出与定位计算很相似,不过定位关心的是成员在集合中的位置,而选出关心的是成...

  • 数据挖掘建模需要什么样的数据?多大量?

    数据挖掘通常需要结构化数据才能建模,而不是近些年来热闹的非结构化数据,预测建模仍然是结构化数据上的运算! 所谓结构...

  • 结构化数据上的 TopN 运算

    1. 最大值 / 最小值 最大值 / 最小值可以理解为 TopN 查询中,N 等于 1 时的情况,因为很常用所以单...

  • 结构化文本计算示例(二)

    上一节讲述了结构化文本的一些基本运算,本节继续用案例讲述二目运算和综合运算。 二目运算 集合运算(文件比较) 现有...

  • 第2章 数据化运营的数据来源

    企业数据化运营的数据来源:从结构类型上分为:结构化和非结构化(网页、文本、图像、视频、语音)从数据来源类型上分为:...

  • 全文检索技术--理论篇

    什么是全文检索技术? 数据分类,一共分为两种:结构化数据和非结构化数据通俗上讲,做开发的同学应该对结构化的数据已经...

  • 布尔检索

    布尔检索 IR:广义上指信息获取。 非结构化数据:没有清晰和明显的语义结构的数据,严格意义上讲,非结构化数据并不存...

  • Pandas

    Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数...

  • 对于个别点位实时流回溯正常,历史流回溯偏差逐步加大分析

    1. 从结构化流程上看,视频结构化结果是来自结构化后元数据存储到大数据平台,结构化的图片本地存储,在结构化过程中v...

  • 大数据的结构和特征

    一、大数据的结构 1.大数据的结构化 大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部...

网友评论

      本文标题:结构化数据上的选出运算

      本文链接:https://www.haomeiwen.com/subject/spzwbktx.html