美文网首页
Hive概述

Hive概述

作者: reco171 | 来源:发表于2022-02-24 15:40 被阅读0次

  Hive是一款基于Hadoop的数据仓库,用于统计海量结构化数据。Hive能够将HQL语句转换成MapReduce程序的一个工具,非java开发人员只需要写HQL语句,就能够对hdfs上的数据做 MapReduce 操作。Hive的元数据依赖于关系型数据库,其真实数据是存在于Hadoop之上的HDFS。
1.Hive服务端组件
Hive服务端组件主要包括Metastore and Diver组件及thrift服务。
(1)Driver组件:包括编译器、优化器、执行器,作用是将我们写的HQL进行解析、编译优化、生成执行计划,然后调用底层的marreduce计算框架。
(2)metastore组件
  metadata即元数据。元数据包含用Hive创建的database、tabel等的元信息。元数据存储在关系型数据库中。如Derby、MySQL等。
Metastore的作用是:客户端连接metastore服务,metastore再去连接MySQL数据库来存取元数据。
有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL数据库的用户名和密码,只需要连接metastore 服务即可。

  1. Hive作业处理流程
      从客户端编辑 sql 语句提交到服务端,通过解释器,编译器,优化器生成执行计划,然后提交到 Hadoop 集群运行。
      其中计划执行的最小单元是一个个 operator,每个operator代表一个操作或者一个MR作业。
  2. 分区分桶
    (1)分区
    分区键:每个表可以有一个或多个用于决定数据如何存储的分区键。分区(除存储单元之外)也允许用户有效地识别满足指定条件的行;例如,STRING类型的date_partition和STRING的country_partition。这些分区键的每个惟一的值定义了表的一个分区。例如,所有的“2009-12-23”日期的“US”国家数据,是表page_views的一个分区。
    (2)分桶
    对于hive中每一个表、分区都可以进一步进行分桶。分桶表是对列值取哈希值的方式,将不同数据放到不同文件中存储。由列的哈希值除以桶的个数来决定每条数据划分在哪个桶中。桶可以被用于有效地抽样数据。例如,表page_views可能通过userid分成桶,userid是表page_view的一个列。
    参考:
    Hive知识归纳——详解 hive 各个知识点
    大数据时代的技术hive:hive介绍
    Hive 教程(官方Tutorial)

相关文章

  • 数据仓库Hive

    Hive产生背景 Hive概述 HIve体系架构 Hive部署架构 Hive和RDBMS区别 Hive部署以及快速...

  • Hive 入门

    Hive官网 Hive概述 Hive 的底层执行引擎有 :MapReduce,Tez,Spark- Hive on...

  • 大数据开发之Hive优化篇2-Hive的explain命令

    备注:Hive 版本 2.1.1 一.Hive explain命令概述 Hive的explain命令用来看Hive...

  • hive概述

    与数据库的区别: 查询语言相似、执行引擎不相似 数据更新不同、延时性不同 索引 数据规模、可扩张性 元数据信息: ...

  • Hive概述

    Hive概念 由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工...

  • Hive概述

      Hive是一款基于Hadoop的数据仓库,用于统计海量结构化数据。Hive能够将HQL语句转换成MapRedu...

  • 大数据开发之Hive篇5-Hive数据查询语言

    备注:Hive 版本 2.1.1 一.Hive SELECT(数据查询语言)概述 select语句是Hive中使用...

  • hive(一):hive概述

    2.1 Hive安装地址 1)Hive官网地址 https://hive.apache.org/[https://...

  • hive(一):hive概述

    1.1 什么是Hive 1) Hive简介 2) Hive本质:将HQL转化成MapReduce程序 [图片上传失...

  • 动态分区说明

    Hive分区 Hive的动态分区 概述 hive中支持两种类型的分区: 静态分区SP(static partiti...

网友评论

      本文标题:Hive概述

      本文链接:https://www.haomeiwen.com/subject/cijozltx.html