美文网首页
元数据说明

元数据说明

作者: 灯火gg | 来源:发表于2020-08-10 14:55 被阅读0次

元数据简介

元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。它的作用类似于数据库管理系统的数据字典,保存了逻辑数据结构、文件、地址和索引等信息。

元数据是数据仓库管理系统的重要组成部分,元数据管理器是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。

目前存在问题:

  • 查看表信息不方便(查看、检索、表复用)
  • 表依赖关系不清楚(血缘关系)
  • 表信息过少(维护者、量级、是否可用)
  • 表权限管理、数据管理、数据质量监控

元数据数据模型

Metadata Groups Metadata
Basic 大小、格式、别名、最后一次修改时间、 权限访问控制表
Content-based 结构、条数、数据图谱、主键、频繁词汇、相似数据集
Provenance 读任务、写任务、下游数据集、上游数据集
User-supplied 描述、注释
Team and Project 项目描述、所属团队
Temporal 修改历史

可参考 Goods: Organizing Google’s Datasets论文

Hive元数据设计

表名 说明 关联键
TBLS 所有hive表的基本信息 TBL_ID,SD_ID
TABLE_PARAM 表级属性,如是否外部表,表注释等 TBL_ID
COLUMNS Hive表字段信息(字段注释,字段名,字段类型,字段序号) SD_ID
SDS 所有hive表、表分区所对应的hdfs数据目录和数据格式 SD_ID,SERDE_ID
SERDE_PARAM 序列化反序列化信息,如行分隔符、列分隔符、NULL的表示字符等 SERDE_ID
PARTITIONS Hive表分区信息 PART_ID,SD_ID,TBL_ID
PARTITION_KEYS Hive分区表分区键 TBL_ID
PARTITION_KEY_VALS Hive表分区名(键值) PART_ID

相关文章

  • 元数据说明

    元数据简介 元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。它的作用类似于数据库管...

  • 数据库-day04

    多表连接查询环境准备 多表连接说明: 外连接 show语句 元数据获取 什么是元数据? 元数据 回去方法 info...

  • Android——Annotation 注解

    关于原数据的说明 元数据由 metadata 译来,所谓的元数据就是“关于数据的数据”,更通俗的说就是描述数据的数...

  • 注解笔记

    元数据 定义:就是对数据进行说明的数据作用:用于生成文档、代码分析、编译检查 注解 注解就属于一种元数据,是对代码...

  • 七 Django模型元选项

    元选项(非必须) 数据库元数据就是指定义数据库各类对象结构的数据,是表级操作 1、abstract 说明表示模型是...

  • HTML 中常用的 meta 元素

    meta元素是一个元数据内容,常用于定义页面的说明,关键字、最后修改日期等元数据,这些元数据将服务员浏览器、...

  • Spring-注解声明

    一、概要 前期说明 注解本身没有功能的,就和xml一样。注解和xml都是一种元数据,元数据即解释数据的数据,这就是...

  • 自定义编译期注解

    什么是注解 注解(Annotation),也叫元数据(即描述数据的数据),一种代码级别的说明。 它是JDK1.5及...

  • HTML meta标签与属性介绍(学习)

    meta常用于定义页面说明、关键字、最后修改日期,和其他的元数据。这些元数据将服务于浏览器(如何布局或者重载页面)...

  • meta 标签内属性详解

    meta常用于定义页面的说明,关键字,最后修改日期,和其它的元数据。这些元数据将服务于浏览器(如何布局或重载页面)...

网友评论

      本文标题:元数据说明

      本文链接:https://www.haomeiwen.com/subject/ayjqrhtx.html