美文网首页
元数据中心的简单思路

元数据中心的简单思路

作者: 傻疯子 | 来源:发表于2021-12-21 21:55 被阅读0次

元数据可以简单解释为数据的数据,而元数据可以分为数据字典、数据血缘和数据特征,是统一指标和业务口径的前提。

元数据中心的核心就是搜集管理元数据信息,并提供元数据信息服务。

数据字典:表名、注释、产出表的任务,表的字段、含义和类型。

数据血缘:这个表是通过哪些表加工而来,甚至每个字段是怎么来的。

数据特征:存储大小、访问情况、主题域、分层、表关联的指标。

实现思路

数据字典:
通过连接各个数据源,获取各个数据库的元数据信息,将信息集成在一起。

数据血缘:
主要有三种方式
静态解析sql:获得输入和输出表,未执行正确性存在问题。
解析任务日志:获取执行后的输入输出表,时效性差。
抓取正在执行的的sql:通过解析执行计划获取输入输出表,将解析内容由kafka插入图数据库,通过图数据库进行分析。采集Hive Hook,Spark Listener,Flink Hook等,图数据由neo4j。

数据特征:
人工打上标签,统计一些存储信息和使用人员交互信息。

实现的功能

支持多业务线和多租户。
对多种数据源支持。
采集、分析数据血缘、字段血缘、血缘生命周期管理。
用Ranger做数据权限管理。
数据特征做包括数据标签如包括主题域、分层信息,以及数据访问度等。
元数据服务,支持多维度的数据信息检索。

相关文章

  • 元数据中心的简单思路

    元数据可以简单解释为数据的数据,而元数据可以分为数据字典、数据血缘和数据特征,是统一指标和业务口径的前提。 元数据...

  • Dubbo元数据中心

    1 元数据中心介绍 元数据中心是dubbo2.7版本之后新增的功能,主要是为了减轻注册中心的压力,将部分存储在注册...

  • Day 2063:学习

    #数据中台 数据地图是基于元数据中心构建的一站式企业数据资产目录,可以看作是元数据中心的界面。数据开发、分析师、数...

  • 按需适配的日本服务器如何选择

    IDC日本发布了运营商数据中心投资预测显示:2017年日本数据中心投资783亿日元。2018年由东京和大阪建立新的...

  • 关于负载均衡和服务发现,Google的经验在这里

    数人云老王:今天主要分享三个议题,首先是Google数据中心的简单介绍——Google数据中心约有200万台X86...

  • 元数据

    元数据中心需要实现三大模块的内容。(1)数据整合。(2)数据管理。(3)数据地图。 元数据的类型有很多,如以下几类...

  • 几种简单常用的排序

    1.简单排序 所谓简单排序就是 int[] arr ={2,4,5,7,6,8,1,9}; 1.基本思路选择一个元...

  • 一篇文章教你部署企业SDN数据中心

    SDN数据中心或许是未来的大趋势,但这并不意味着这只是一个简单的转换。因此,如果您企业希望在部署SDN数据中心方面...

  • 11月2日

    昨天介绍了一下数据中心的外延,今天说一下数据中心的内涵。所谓数据中心的内涵就是从数据中心的出口位置一直到数据中心内...

  • LinkedIn 开源其数据中心工具 WhereHows

    LinkedIn 近期开源了一个元数据中心工具 WhereHows,已经在LinkedIn内部长期使用。Where...

网友评论

      本文标题:元数据中心的简单思路

      本文链接:https://www.haomeiwen.com/subject/paeofrtx.html