hive相关知识点

作者: evanzh7 | 来源:发表于2019-07-23 23:03 被阅读0次
  1. hive架构
    组件:

    1. meta store
    2. cli client
    3. jdbc client
    4. driver
    5. sql parser解析器
    6. physical plan编译器
    7. query optimizer优化器
    8. execution执行器
  2. hive语句调优常见参数

  3. 各种sql语句hvie如何实现
    3.1 join的实现原理
    Map:

1、以 JOIN ON 条件中的列作为 Key,如果有多个列,则 Key 是这些列的组合

2、以 JOIN 之后所关心的列作为 Value,当有多个列时,Value 是这些列的组合。在 Value 中还会包含表的 Tag 信息,用于标明此 Value 对应于哪个表

3、按照 Key 进行排序

Shuffle:

1、根据 Key 的值进行 Hash,并将 Key/Value 对按照 Hash 值推至不同对 Reduce 中

Reduce:

1、 Reducer 根据 Key 值进行 Join 操作,并且通过 Tag 来识别不同的表中的数据
3.2 group by的实现原理

3.3 distinct的实现原理

  1. sql转化为mapreduce的过程
    • Antlr定义SQL的语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树AST Tree
    • 遍历AST Tree,抽象出查询的基本组成单元QueryBlock
    • 遍历QueryBlock,翻译为执行操作树OperatorTree
    • 逻辑层优化器进行OperatorTree变换,合并不必要的ReduceSinkOperator,减少shuffle数据量
    • 遍历OperatorTree,翻译为MapReduce任务
    • 物理层优化器进行MapReduce任务的变换,生成最终的执行计划
  2. Hive 编译器的工作职责
    (1)Parser:将 HQL 语句转换成抽象语法树(AST:Abstract Syntax Tree)

(2)Semantic Analyzer:将抽象语法树转换成查询块

(3)Logic Plan Generator:将查询块转换成逻辑查询计划

(4)Logic Optimizer:重写逻辑查询计划,优化逻辑执行计划

(5)Physical Plan Gernerator:将逻辑计划转化成物理计划(MapReduce Jobs)

(6)Physical Optimizer:选择最佳的 Join 策略,优化物理执行计划

相关文章

  • hive相关知识点

    hive架构组件:meta storecli clientjdbc clientdriversql parser解...

  • Hive必知必会

    这是Hive知识点的一个大纲,后续会不断地更新完善,做到对Hive相关知识点有一个比较全面的总结归纳,争取2020...

  • hive相关

    HQL优化 1. HQL优化 一、避免or操作的不当。如果where子句中有多个条件,并且其中某个条件没有索引,使...

  • hive 相关

    hive 相关 搭建hadoop和hive,mysql的环境,过程截图 1.hadoop install 2.m...

  • hive相关

    Hive也是数据库的一种,hivesql和mysql使用起来并没有什么不同,数据插入、表关联查询都是一样的,二者都...

  • hive相关基础

    hive相关基础 1、进入到hive命令下;(linux下直接输入hive即可) hive 2、查看工作分区下的h...

  • 面试题汇总:Hive

    1.《大数据Hive 面试以及知识点》 2.《Hive学习之路 (十一)Hive的5个面试题》 3.《大数据工程师...

  • hive虚拟列

    火山日常啰嗦 讲讲hive的小知识点--虚拟列 hive虚拟列有两种: 1)INPUT__FILE__NAME 输...

  • 大数据学习教程

    Hadoop生态 Hadoop相关内容 Spark Spark系列教程 Hive Hive快速入门 Elastic...

  • docker 构建hadoop 环境

    技能库 docker 相关 linux 相关 shell 相关 hadoop hive 准备文件 jdk 安装包:...

网友评论

    本文标题:hive相关知识点

    本文链接:https://www.haomeiwen.com/subject/vtpzlctx.html