1.hive哪些sql会触发mr job
聚合,某些insert
2.create table t as select ...这样的SQL会不会创建mrjob
会
3.hive的数据分为哪两块 分别存储哪里
元数据,mysql 真实数据 hdfs
4.一般工作中,udf编写是很多的,那么怎样临时生效,永久生效?
生产上都是临时的,封装在shell脚本里
5.那么在工作中,一般分区表用的很多,那么一般我们会选择哪些特征值作为分区字段?
时间
6.生产上 分区表 又分为静态分区表和动态分区表,那么区别是什么?怎样实现?(拓展题,公众号有篇博客参考)
静态根据指定字段和给定值分区,动态分区值在字段里
7.vi命令 从window复盖一个文件内容到Linux的文件,哪些步骤?
有个快捷键不加 会丢失复制的开头部分数据
8.谈谈对jps理解
jps java进程。
9.谈谈对pid文件理解
临时存储进程的id的文件,用来杀进程的时候使用
10. 输入一个命令,找不到,not found,请问你们觉得应该怎么办
看拼写,查环境变量
网友评论