1. hive数据分为哪两块?分别存储在哪?
元数据和数据本身; hdfs和mysql
2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)
定义分区,分隔字符,内外表之分
3. 默认的换行符和分割符是什么?
/t /r
4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?
load overwrite;load data local inpath xx into table xxx
5. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?
聚合分组连接,insert overwrite也会触发mr,只是没有reduce,不光光是聚合才会触发吧
6. create table a as select * from b; 你们觉得有没有mr job?(好像要加as 我不太确认)
有,要
7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询
partitioned by,这两个分区是一样的,只是导入数据的方式不一样,动态可以设置分区字段然后自动分区
8. 静态分区表和动态分区表是什么区别?
手动和自动建分区
9. 查看函数的是什么语法?
常见的聚合函数,还有一些字符处理函数,比如大小写转换,字符串截取
10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?
支持
网友评论