美文网首页
2023 Hive 面试大纲

2023 Hive 面试大纲

作者: fx67ll | 来源:发表于2023-07-12 11:42 被阅读0次

先说一些废话

总结一下Hive面试宝典中的要点,方便读者快速过一遍Hive面试所需要的知识点。
本文请搭配 Hive面试宝典 来食用更美味哟 ┗( ▔, ▔ )┛

方便自己系统性回忆,根据*的数量来标记重要性

* 简单了解
** 熟悉掌握
*** 需要精通

  1. Hive的介绍(*)
    • Hive和Hadoop的关系
    • Hive的特点
    • Hive的缺点
    • Hive常见的应用场景
    • Hive和mysql的区别
  2. Hive的架构(*)
  3. Hive的数据(**)
    • Hive的数据模型
    • Hive的底层如何存储Null值
    • Hive中元数据metadata和元数据商店metastore)`的作用
    • Hive有哪些保存元数据metadata的方式
    • Hive元数据存储方式中,本地模式和远程模式的区别
    • Hive的数据类型
    • Hive的隐式类型转换规则
    • Hive数据存储所使用的文件格式
    • Hive中使用的压缩算法
    • 什么是数据可分割
    • 关于压缩模式说明
  4. Hive的安装与使用(*)
    • 如何在Hive中集成HBase
    • 如何通过 HiveSQL 来直接读写 HBase
  5. Hive的分区和分桶(**)
    • 什么是Hive分区
    • Hive分区的优点
    • Hive分区的缺点
    • 什么是Hive分桶
    • 关于Hive索引的说明
    • Hive分桶的优点
    • Hive分桶的缺点
    • Hive中静态分区和动态分区的区别
    • Hive动态分区的参数设定
  6. Hive的内部表和外部表(*)
    • 什么是Hive的内部表和外部表
    • Hive内部表和外部表的区别是什么
    • 生产环境中为什么建议使用外部表
  7. Hive SQL(***)
    • Hive中的SQL如何转化成MapReduce任务的
    • 什么情况下Hive不走MapReduce任务
    • Hive中如何查询A表中B表不存在的数据
    • Hive中有哪些连接查询以及如何使用
    • Hive中左连接和内连接的区别
    • Hive中左连接的底层原理
    • Hive查询时候 ON 和 WHERE 有什么区别
  8. Hive 函数(***)
    • 如何使用UDF/UDAF/UDTF
    • 为什么使用UDF/UDAF/UDTF
    • 你写过什么样的UDF/UDAF/UDT
    • Hive自定义函数实现了什么函数什么接口
    • Hive中如何去重
    • Hive中排序函数的使用方式及区别
    • 请说明以下常用函数 split / coalesce / collect list / collect set 的功能
    • 请描述工作中常用的Hive常用函数及使用场景
  9. Hive 运维(*)
    • 如何监控一个提交后的Hive状态
  10. Hive 优化(***)
    • 请说明你在工作中如何进行Hive优化
    • HiveSQL优化 ———— Hive单表查询优化
    • HiveSQL优化 ———— Hive多表查询优化
    • HiveSQL优化 ———— Hive其他查询优化
    • Hive数据倾斜 ———— 单表携带了 Group By 字段的查询
    • Hive数据倾斜 ———— 两表或多表的 join 关联时,其中一个表较小,但是 key 集中
    • Hive数据倾斜 ———— 两表或多表的 join 关联时,有 Null值 或 无意义值
    • Hive数据倾斜 ———— 两表或多表的 join 关联时,数据类型不统一
    • Hive数据倾斜 ———— 单独处理倾斜key
    • HiveJob优化 ———— HiveMap优化方案
    • HiveJob优化 ———— HiveReduce优化方案
    • Hive整体优化方案

我是 fx67ll.com,如果您发现本文有什么错误,欢迎在评论区讨论指正,感谢您的阅读!
如果您喜欢这篇文章,欢迎访问我的 本文github仓库地址,为我点一颗Star,Thanks~ :)
转发请注明参考文章地址,非常感谢!!!

相关文章

  • 数仓--Hive--面试题准备

    数仓--Hive-面试之Hive与HBase的区别数仓--Hive-面试之Hive架构原理数仓--Hive-面试之...

  • 面试题汇总:Hive

    1.《大数据Hive 面试以及知识点》 2.《Hive学习之路 (十一)Hive的5个面试题》 3.《大数据工程师...

  • 面试文化工具:文化面试大纲是什么?

    面试文化的工具:文化面试大纲 (一)文化面试大纲是什么? 文化面试大纲:就是在招聘时做文化认同的测试与考察的工具。...

  • Hive面试

    1.描述一下Hive的基本架构? 用户接口CLI:Shell终端命令行,采用交互式方式与Hive进行交互JDBC/...

  • 面试大纲

    cms系统 掘金 程序员小灰 csdn 微信公众号 java 技术栈 cas 机制 设计模式 常见的算法模型 io...

  • 面试大纲

    https://www.kancloud.cn/smartsean/android/1106138

  • 面试大纲

    用户运营:用户分类(用户属性、用户关键行为) 用户激励体系(积分、等级) 用户召回裂变:(目的、目标、主题、海报...

  • 面试大纲

    基础算法 排序 查找 动态规划 并发编程 复习资料 《java并发编程的艺术》 https://redspider...

  • Hive相关文章索引(2)

    环境部署 HiveServer2的高可用-HA配置 基本常识 大数据Hive 面试以及知识点 hive实现upda...

  • Java面试大纲

    转载:http://url.cn/5yZONtY跳槽时时刻刻都在发生,但是我建议大家跳槽之前,先想清楚为什么要跳槽...

网友评论

      本文标题:2023 Hive 面试大纲

      本文链接:https://www.haomeiwen.com/subject/utqpudtx.html