美文网首页
数据质量的问题与建设

数据质量的问题与建设

作者: 傻疯子 | 来源:发表于2021-12-28 17:04 被阅读0次

导致数据异常的原因:
业务系统方的问题,可能是表结构或者是环境的变更,也可能是相关bug导致数据异常。
数据开发问题,任务上线后数据源、分区未进行更换,未处理异常格式,任务依赖关系错误。
资源问题,由于数据量暴涨或者新任务的提交导致资源不够,未及时产出出局。
基础设施故障,软硬件的bug导致任务未正常运行。

而在数据出现异常时常常会伴随着这样几个问题:
开发人员发现得晚,容易到相关人员实用时才发现并投诉。无法快速定位问题源。
上游出现数据异常时,下游依然正常运行,等修复时需要花费长时间重跑。

所以核心就是要尽快恢复数据异常。

提高数据质量解决方法:
添加稽核校验任务,根据规则对表进行检查,出现相关问题进行报警,并根据需要决定是否终止后续任务运行。可以建立全链路的任务校验,及时发现问题出在哪,资源有限的情况只对核心任务进行校验。在无法按时产出的情况要保证重要任务优先运行。
规则包括但不限于完整性规则、一致性规则、准确性规则。完整性规则主要是衡量数据的完整度问题,数据是否异常;一致性规则主要是多个数据之间有一定的换算关系,是否可以相互验证;准确性规则主要是数据相关格式是否正确。同时根据业务情况需要补充一些业务规则。

数据质量衡量的方法:
可以统计规定时间内任务完成率。根据数据稽核规则进行数据评分,以供改进。统计需要立即处理的报警此处。计算最终应用上的数据不可用时间。

数据质量中心:
创建稽核校验的规则以及对以上提到的稽核任务进行监控和统计,并对相关数据质量进行评分。

相关文章

  • 数据质量的问题与建设

    导致数据异常的原因:业务系统方的问题,可能是表结构或者是环境的变更,也可能是相关bug导致数据异常。数据开发问题,...

  • 数据中台成熟度模型来了,你属于哪个级别

    如何回答如下问题:1)数据中台如何建设?2)我们企业数据量小,只有数据集市,是否适合建设数据中台?3)企业数据质量...

  • CDMP(Data Quality Management)

    数据质量管理 数据质量管理的思考 元数据为什么对数据质量管理如此重要 演进在数据质量问题中扮演什么角色 数据质量改...

  • 数据治理与数据清洗

    大数据建设中会出现数据混乱、数据重复、数据缺失等问题,就需要对非标数据进行处理,涉及到数据治理与数据清洗,常常把数...

  • 数据治理

    为什么需要: 野蛮式增长背后都是烟囱式的数据建设,随之而来,数据存储,数据模型建设(数据冗余,数据孤岛问题非常多)...

  • 旅游开发027:旅游厕所AAA

    旅游厕所的建设和管理标准主要依据《旅游厕所质量等级的划分与评定》及《旅游厕所质量等级评分细则》,要建设和管理好旅...

  • 大数据后端工程师招聘(golang)

    大数据后端开发工程师(Golang) 一、岗位职责 1、参与建设公共数据平台,实现高质量的数据互通与共享,发掘数据...

  • 【AI数据建设1】数据收集

    AI时代,数据为王。那么AI数据是如何建设的?本文将以人脸和声纹数据为例,先从AI数据的渠道来源说起。 前言 质量...

  • DataWorks实战2-业务流程的模块规划

    数据仓库主要包含数据集成、数据计算、数据服务、数据质量、数据资产等模块。在数仓建设中,对数据开发者说最主要工作在数...

  • 证券行业数据治理案例

    简化版 数据质量方面的经验教训: 数据质量是对数据可用性的提升,而非追求“完美”,不 是为了管理而管理数据质量问题...

网友评论

      本文标题:数据质量的问题与建设

      本文链接:https://www.haomeiwen.com/subject/nsvpqrtx.html