这是Hive知识点的一个大纲,后续会不断地更新完善,做到对Hive相关知识点有一个比较全面的总结归纳,争取2020年7月之前完成
环境搭建
- Hive集群环境搭建
- Hive源码阅读环境
Hive架构
- Hive整体架构
- Hive存储格式
- Hive数据类型
- 执行引擎
DDL
- DDL-数据库操作
- DDL-内部表&外部表
- DDL-分区表&分桶表
DML
- DML-数据导入、导出、Update、Delete、Merge
DQL
- select ... from
- where
- group by ... having ...
- join
- order by、sort by、distribute by
- 窗口函数
UDF
- UDF 和 GenericUDF
- UDAF 和 UDTF
优化
- 执行计划
- map-side join
- 大表join
- 数据倾斜
网友评论