参考资料:
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。通常hive包括以下四种数据导入方式:
(1)、从本地文件系统中导入数据到Hive表;
(2)、从HDFS上导入数据到Hive表;
(3)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中;
(4)、从别的表中查询出相应的数据并导入到Hive表中。
最近偶尔会写一些Hive Sql,发现还是和Sql有一些不一样的地方,有一些坑,故记录下来
1.Hive Sql不支持Not In后面跟子查询,需要用left join代替
2.Hive Sql中的Join只支持等值join,也就是说On后面的连接条件只能是=,而不能是<= <>等符号
详见:轻松玩转hive中各种join之间的关系以及使用
网友评论