Hive概论

Hive概论

作者: _Unique_楠楠 | 来源:发表于2020-05-20 10:15 被阅读0次

Hive概论
数据仓库Hive
数据查询-Hive基础
大数据知识 | hive初识
Hive | Hive 安装详解
Hive日常使用
Hive常用的几种交互操作
【Hive】
Hive进阶
Hive 入门

1.什么是Hive

Hive : 由Facebook 开源用于解决 <u>海量结构化日志</u> 的数据统计。
Hive是基于Hadoop的一个<u>数据仓库工具</u>，可以将 <u>结构化的数据文件映射为一张表</u> ，并提供 <u>类SQL</u> 查询功能

本质是：将HQL转为MapReduce程序

Hive处理的数据存储在Hdfs
Hive分析数据底层的实现 <u>默认是 MapReduce</u> (可以换成其他的)
Hive运行程序是在yarn上的

总结：可以吧Hive理解为一个客户端，方便你去调度Hadoop，所以它不是一个分布式的框架，而是一个客户端工具。

image

2.Hive的优缺点

2.1 优点

操作接口采用类SQL写法，提供快速开发能力
避免了写MapReduce，减少学习成本
Hive执行的延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场景
Hive优势在于处理大数据，对于小数据处理没有优势
Hive支持用户自定义函数，用户可根据自己的需求定义函数

2.2缺点

Hive的HQL表达能力有限
- 迭代式算法无法表达
- 数据挖掘方面不擅长
Hive的效率比较低
- Hive自动生成的MapReduce作业，通常情况下不够智能
- Hive调优比较困难，粒度较粗

相关文章

Hive概论
1.什么是Hive Hive : 由Facebook 开源用于解决海量结构化日志的数据统计。 Hive是基...
数据仓库Hive
Hive产生背景 Hive概述 HIve体系架构 Hive部署架构 Hive和RDBMS区别 Hive部署以及快速...
数据查询-Hive基础
outline 什么是Hive 为什么需要Hive Hive的架构 Hive的常用操作什么是Hive Hive由...
大数据知识 | hive初识
hive简介 hive架构 hive是什么官网这样说：https://hive.apache.org/ hive...
Hive | Hive 安装详解
一、Hive 介绍二、准备工作三、Hive下载四、Hive 安装五、Hive 启动一、Hive 介绍 H...
Hive日常使用
hive 创建表： hive 执行： =========================hive 调用Python...
Hive常用的几种交互操作
查看hive下的交互命令方式 -help（hive 外）命令：bin/hive -helpusage: hive...
【Hive】
Hive的安装 Hive官网地址 http://hive.apache.org/[http://hive.apac...
Hive进阶
hive配置，命令 hive查询显示列名 hive默认分隔符 \001 hive命令行中查看当前hive环境变量 ...
Hive 入门
Hive官网 Hive概述 Hive 的底层执行引擎有：MapReduce，Tez，Spark- Hive on...

网友评论

大数据

本文标题：Hive概论

本文链接：https://www.haomeiwen.com/subject/jjlgohtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

大数据

关于我们|服务条款|联系我们|Hive概论|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！