2.1 Hive安装地址
1)Hive官网地址
2)文档查看地址
https://cwiki.apache.org/confluence/display/Hive/GettingStarted
3)下载地址
https://archive.apache.org/dist/hive/
4)github地址
https://github.com/apache/hive
2.2 Hive安装部署
2.2.1 安装Hive
hive3.1.2
下载
解压
环境变量
初始化数据库
9820 nameNode
Hive三种引擎:
mr、sprck、tez
Hive在查询数据的时候,由于没有索引,需要扫描整个表,因此延迟较高。另外一个导致Hive执行延迟高的因素是MapReduce框架。由于MapReduce本身具有较高的延迟,因此在利用MapReduce执行Hive查询时,也会有较高的延迟。相对的,数据库的执行延迟较低。当然这个低是有条件的,即数据规模越小,当数据规模大道超过数据库的处理鞥哪里的时候,Hive的并行计算显然能提现出优势。
网友评论