美文网首页
如何学会使用一张数据表

如何学会使用一张数据表

作者: 2453cf172ab4 | 来源:发表于2019-03-10 22:04 被阅读7次

今天带来的是我自己处理业务的时候,在接触到一个新的数据表的学习和使用流程,我相信多数的研发和数据分析师和我面临同样的问题。


以下,Enjoy:


01

熟悉业务

我们接触的每一个数据表并非偶然,一定会有带有某种场景需求。比如我们要计算一个APP的订单数据,每日活跃用户数……我们总是带着问题去寻找数据。


反之亦然,我们拿到一张数据表,要搞清楚这个表的数据是怎么生产出来的,比如用户打开APP产生的埋点日志,用户下单产生的业务订单数据……


又或是我们已经不需要从最源头去背书一张数据表,而是非常精确的知道一个表的作用和意义,比如A表内是APP内XXX业务的订单数据,B标示XXX业务的商家数据,C表是经过A+B加工而成的商家订单宽表数据……


在以上三种情况下,我们首先要了解的是业务,业务的场景是什么,数据是通过业务怎么产生的。埋点日志是用户访问和点击的时候产生的,订单数据是用户创建并支付订单时候产生的,商家信息是商家注册或者合同数据上传产生的……


无论是数据工程师还是数据分析师,只要从事业务方面的工作,对业务的了解越深入也会后期发挥更大的意义和作用。

02

数据生产


以订单数据表为例,我们不仅要熟悉整体的业务场景,还需要更细节的熟悉每个数据在什么情况下产生。
订单ID:当用户提交订单的时候,系统生产的唯一值。 订单金额:用户提交订单的商品价格(如果有优惠活动,这里的口径就会变化多端) 支付金额:用户实际支付的金额(比如用户有一个10元的优惠券,那么订单金额可定义为100,支付金额为90元) 支付超时5500:比如我们对创建订单后30分钟内不支付的订单,默认失效返回一个5500超时编码 ……
以上例子期望说明的是我们需要了解每一个字段在业务场景中哪个环节生成,都代表了什么业务含义。

03

数据探查


最后一步的数据探查主要是熟悉并了解表中的内容,并且校验前面两部分的理解是否到位,我自己数据探查一般从以下几个方面开始:


1、查询每日数据增量量级,会连续查询一段时间看数据的趋势;

2、如果整体量级不是很大,我会查一下全量数据有多大;

3、查询数据表的开始日期,尤其看前期的数据是否存在丢失或不全的情况;

4、根据量级选取一部分明细数据(千八百条),仔细辨别每个字段的格式和内容,如果量级不够使得数据不具有代表性会再次选取更多数据观察;

5、初步判断取值格式和内容之后,对字段进行全局的校验。比如订单ID如果是23456678,那么出现a567、fhsas的情况是否合理。

6、对于数量有限的取值字段,根据数据量级查询全表枚举值,并且以枚举值对应业务场景,看是否都在自己认知的合理范围内。


04

其他


因为经常要处理很多业务的数据,每天面临很多数据表的接手。因此我都会在数据探查之后,数据使用之前建立文档记录数据表结构和问题


这不仅方便部门协作之间的沟通,也方便同事之间的相互沉淀和学习。在组内避免了很多重复工作。

相关文章

  • 如何学会使用一张数据表

    今天带来的是我自己处理业务的时候,在接触到一个新的数据表的学习和使用流程,我相信多数的研发和数据分析师和我面临同样...

  • 分布式列式数据库 —— HBase

    一、BigTable 1、产生背景   使用传统的关系型数据库时,需要根据应用系统设计一张张的数据表,数据表可以看...

  • 使用python-docx生成Word文档

    学会来使用python操作数据表和PDF,今天我们尝试下使用python操作Word文档。 首先是安装python...

  • 公式 - 关联列

    上一讲,我们看到了如何定义页面数据,以及使用页面数据,但都是集中在查找的数据表本身的字段,如果要使用数据表关联的其...

  • 高效数据整理工具——dplyr(二)多数据框处理

    在高效数据整理工具——dplyr(一)中,简要介绍使用dplyr对但数据表的处理,在本节中将会学习如何使用dply...

  • Mysql的数据表创建操作

    1 创建、查看数据表 2 创建数据表(使用主键约束,2种方式) 3 创建数据表(多字段联合主键) 4 创建数据表(...

  • iOS中SQLite使用

    iOS中SQLite使用 创建数据表 向数据表中添加数据 从数据表中删除数据 修改数据表中的数据 读取数据表 ma...

  • myspl模块化

    什么是关系型数据库 如何进行数据表的增删改查 使用mysql模块操作对数据表进行增删改查 什么是模块化 封装db模...

  • 【读书清单】崭新的理所当然(松浦弥太郎)(1)

    001 心中的桌子 在心中备出一张小桌供自己使用,也备一张大桌供他人使用。一个人既要学会独处思考,也要学会与人共处...

  • DBFlow使用

    PS: 都说DBFlow使用,话说,真的有人在实际开发中使用这个数据库框架么? 问题一: 如何修改数据表中字段的类...

网友评论

      本文标题:如何学会使用一张数据表

      本文链接:https://www.haomeiwen.com/subject/texmpqtx.html