Hive入门

Hive入门

作者: 学术界末流打工人 | 来源:发表于2020-02-06 17:03 被阅读0次

[从零开始学Hive]Hive入门
hadoop入门系列--hive的三种集合数据类型array、m
hadoop入门系列--hive中array(或map集合类型)
hadoop入门系列--hive基础
大数据学习教程
Hive的Transform和UDF
Hive底层原理：explain执行计划详解
Hive窗口函数01-SUM、MIN、MAX、AVG
Hive数据仓库之权限管理
Hadoop-Hive基础知识整理

概述

什么是Hive

由Facabook开源用于解决海量结构化日志的数据统计
Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射成一张表，并提供类SQL查询功能；
构建在Hadoop之上的数据仓库；
- 使用HQL作为查询接口
- 使用HDFS存储
- 使用MapReduce计算；
本质是将HQL转化成MapReduce程序
灵活性和扩展性比较好：支持UDF，自定义存储格式等；
适合处理离线数据

Hive在Hadoop生态系统中的位置

Hive在Hadoop生态系统中的位置

Hive架构设计

Hive架构设计

Hive 依赖两个外部程序

HDFS
MapReduce
MySQL ( 图中Meta store ) 存储Hive中的表信息，比如表名，表中有哪些字段，数据存储在哪些地方等等

图解流程：
一. 首先获取SQL 语句通过 CLO JDBC Driver

二. 然后经历四个阶段
图中对应的四个阶段：

SQL Parser： SQL解析，检查SQL语句是否正常
Query Optimizer：编译
Physical Plan：优化
Execution：执行

三. 查询Meta store 中数据存放位置
四. Execution部分执行Map Reduce计算
五. 结果返回给客户端

Hive的优点及应用场景

操作接口采用类SQL语法，提供快速开发的能力（简单，容易上手）；
避免了去写MapReduce，减少开发人员的学习成本
统一的元数据管理，可与impala/spark等共享元数据
易扩展（HDFS+MapReduce）：可以扩展集群规模；支持自定义函数；
数据的离线处理；比如：日志分析，海量结构化离线分析
Hive的执行延迟比较高，因为Hive常用于数据分析的，对实时性要求不高的场合；
Hive优势在于处理大数据，对于处理小数据没有优势，因为Hive的执行延迟比较高

References

【企业级】大数据项目实战

相关文章

[从零开始学Hive]Hive入门
Hive入门 Hive简介 Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Ha...
hadoop入门系列--hive的三种集合数据类型array、m
传送门hadoop入门系列--hive基础hadoop入门系列--hive的三种集合数据类型array、map、s...
hadoop入门系列--hive中array(或map集合类型)
传送门hadoop入门系列--hive基础hadoop入门系列--hive的三种集合数据类型array、map、s...
hadoop入门系列--hive基础
传送门hadoop入门系列--hive基础hadoop入门系列--hive的三种集合数据类型array、map、s...
大数据学习教程
Hadoop生态 Hadoop相关内容 Spark Spark系列教程 Hive Hive快速入门 Elastic...
Hive的Transform和UDF
UDTF Hive中UDTF编写和使用 UDAF Hive udaf开发入门和运行过程详解 Hive通用型自定义聚...
Hive底层原理：explain执行计划详解
不懂hive中的explain，说明hive还没入门，学会explain，能够给我们工作中使用hive带来极大的便...
Hive窗口函数01-SUM、MIN、MAX、AVG
Hive窗口函数sum、min、max、avg入门 1. 数据说明现有 hive 表 cookie1, 内容如下...
Hive数据仓库之权限管理
Hadoop/Hive自带权限控制延续数据仓库之Hive快速入门 - 离线&实时数仓架构[https://www...
Hadoop-Hive基础知识整理
一. Hive入门简介 1. Hive是什么 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件...

网友评论

本文标题：Hive入门

本文链接：https://www.haomeiwen.com/subject/zohuxhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Hive入门|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！