美文网首页
数据治理

数据治理

作者: Eqo | 来源:发表于2023-03-27 15:37 被阅读0次

数据治理分为元数据管理和数据质量管理

元数据管理

  • 技术元数据和业务元数据
  • 我们整个数仓是为三类人使用的
    -- 一个是业务人员,业务人员要知道我们整个数仓处理完成的结果,存放在哪里,存放在数仓那个表里或者哪里可以查看到
    -- 数仓开发人员, 数仓开发人员 要知道 整个数仓的分层, 每层有那些表 表与表之间的血缘关系 ETL策略等
    -- 决策层 要知道整个数仓有哪些业务哪些内容, 根据这些业务和内容能分析出什么方面的结果

解决方案:

  • 宁波银行有一个数据资产门户,在该门户网站上面, 分部门 业务线 存放数仓产出的报表,或者直接搜素报表名称 进行报表查看
    --我在其中就是将我 发布在tableau server 服务器上的报表地址 采集到数据资产门户
  • 就是我们数仓开发人员 能快速上手整个数仓, 我先说我知道 阿帕奇的亚特兰蒂斯 可以根据我们提供的建表语句和 跑批脚本 自动的构建表与表之间的血缘关系
    宁波银行的处理方案是 有一个自研的调度工具 和资源监控工具 jmp ,每次我们投产的时候 手动填写 我们投产脚本所设计的来源表, 然后再jmp上面 可以查看该表的上游表和下游表,还可以查看脚本逻辑 实现表与表之间的血缘关系, 然后字段和字段之间的血缘关系 我们是手动mapping的 不过我们一把都是结合脚本看
    然后通过表明可以查看 etl策略 全量表是05 增量表是03 ods表要加上源系统的名称 方便找源系统业务老师查看

数据质量管理

三部分

数据清洗

主要是缺省值和异常值的处理
  • 缺省值 查看其缺省范围和字段是否重要
    一些字段不重要 缺省的又多可以直接舍弃
    当然先要跟源系统确认, 看一下 是不是数据

  • 异常值
    不允许出现null 值啊, 进行nvl collease 非空转换,
    日期格式, dataformat 进行处理
    或者是两个加工口径,强行合并成一张表 要保持每个字段的规范话
    码值信息要带码值释义,没有要构建码值表
    过滤掉测试数据等

数据预警

  • 主键校检 每张表,会有一个物理主键,必须有业务意义 我的红利计划明细表就是按照 活动id+订单id 进行拼凑的,如果报主键重复 那么我就要查看一下 具体信息
  • 云校检 云校检 主要是跟业务和加工逻辑有关 比如说我之前的红利计划明细表 是过滤的符合该活动的用户 且用户获奖信息可以从两张副表获取得到,有两个渠道 如果有一天 我活动用户的获奖信息 取不到了,会报错 然后我就去分析和调研 看是新增了一个渠道 还是什么情况

数据使用

  • 数据异常
  • 数据时效问题, 某一天某一个月的数据没有, 或者创建的是新表,之前的数据没有
  • 总分对账 某天每个
  • 业务问题 数仓的上游使用人员,了解业务的话 一定是从表中的字段进行理解 当有疑问的情况下,就提交给模型组去问源系统,或者直接去问等
    由模型组 统一处理

总上,还有一个实现的前提条件 就是 开发一定按照数仓规范进行开发

相关文章

  • 数据治理中的有趣发现(一)

    数据治理,一般来说,涉及数据获取的治理、数据流程治理、数仓模型治理、数据权限治理、指标体系治理、数据应用能力提升、...

  • 数据治理

    下面我们主要是从据治理的定义、目的、内容、以及数据治理可能遇到的问题等方面介绍数据治理。 数据治理的定义: 数据治...

  • 数据治理的定义和架构

    数据治理的定义 数据治理(DataGovernance),是企业数据治理部门发起并推行的,关于如何制定和...

  • 数据治理篇-元数据: datahub概述

    前言. 元数据是数据治理的灵魂 1. 元数据之于数据治理 数据治理是一个庞大的系统,其中主要包括数据管控,数据质量...

  • [数据知识]DAMA数据管理—数据治理

    数据治理是数据管理框架的核心职能,本章重点介绍数据治理职能的定义、相关概念和活动。 [核心要点] 数据治理是对数据...

  • 数据资产治理概要:用数据来治理数据

    数据资产治理概要:用数据来治理数据 写作不易,关注下公众号:晓阳的数据小站,就更好了。 |0x00 为什么数据治理...

  • 当年要是早知道这4步框架,我就不会为数据管理发愁了

    一、什么是数据治理? 笔者认为:所有为提高数据质量而展开的业务、技术和管理活动都属于数据治理范畴。数据治理的目的就...

  • Day 1393:数据治理

    数据管控是数据治理体系的基础,10大数据治理职能都需要数据管控,管理数据管控能力在很大程度上直接影响数据治理目标的...

  • 数据治理:指定您的业务战略

    数据治理是数据的策略。 数据治理是作为一个重要的业务计划,治理需要政策,所以在进行治理的时候就需要通过多方协调找...

  • 建设大数据平台,从“治理”数据谈起

    本文目录: 一、大数据时代还需要数据治理吗? 二、如何面向用户开展大数据治理? 三、面向用户的自服务大数据治理架构...

网友评论

      本文标题:数据治理

      本文链接:https://www.haomeiwen.com/subject/pplzrdtx.html