介绍
- 由Facebook开源,最初用于解决海量结构化的日志数据统计问题
- 构建在Hadoop之上的数据库
- Hive定义了一种类Sql查询语言,
HQL
类似SQL但不完全相同 - 通常用于进行离线数据处理(采用MapReduce)
-
底层支持多种不同的执行引擎
- MapReduce
- Tez
- Spark
- Hive on MapReduce
- Hive on Tez
- Hive on Spark
-
支持多种不同的压缩格式,存储格式以及自定义函数
- 压缩:{GZIP,LZO,Snappy,BZIP2}
- 存储:{TextFile,SequenceFile,RCFile,ORC,Parquet}
- UDF: 自定义函数
环境搭建
TODO
image.png
网友评论