美文网首页
HiveSQL分区-DML

HiveSQL分区-DML

作者: MR_ChanHwang | 来源:发表于2018-09-13 17:44 被阅读0次

分区

创建分区表

CREATE TABLE psn5 (
id int,
name string,
likes ARRAY <string>,
address MAP <string,string>
)
PARTITIONED BY (sex string)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '-'
MAP KEYS TERMINATED BY  ':';

以性别分区;分区字段不可与表列名重复!

载入分区表数据

介绍load-data:Hive-DML

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]
 
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] [INPUTFORMAT 'inputformat' SERDE 'serde'] (3.0 or later)

load data local inpath '/root/data' into table psn5 partition (sex='boy');

重新填充假数据

cp data data1并将id改为4,5,6。

load data local inpath '/root/data1' into table psn5 partition (sex='girl');

查询分区数据

SELECT * 
  FROM psn5 
 WHERE sex='boy';

添加分区

    ALTER 
    TABLE psn5 
      ADD 
PARTITION (sex='weizhi');

删除分区

ALTER TABLE psn5
drop PARTITION (sex='boy');

删除分区,对应的数据也被删除

创建多字段分区

CREATE TABLE psn6 (
id int,
name string,
likes ARRAY <string>,
address MAP <string,string>
)
PARTITIONED BY (sex string,age int)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
COLLECTION ITEMS TERMINATED BY '-'
MAP KEYS TERMINATED BY  ':';

实际HDFS目录会按照分区先后来创建文件夹;分区在后面的文件夹在前一个文件夹中。

删除多字段分区

ALTER
TABLE psn6
 DROP PARTITION (sex='boy');

直接会删除指定的分区,不受之后的分区键影响。


DML

load data inpath '/user/data1' into table psn1;

若对应的数据文件目录在HDFS中,则会将文件移动至表数据目录。

若对应的数据文件目录是本地文件,则会复制上传。

若本身已经存在data,再次上传data,则会生成data_copy_1。

相关文章

  • HiveSQL分区-DML

    分区 创建分区表 以性别分区;分区字段不可与表列名重复! 载入分区表数据 介绍load-data:Hive-DML...

  • Hive 分区字段限制

    hivesql分区字段不可以有中文,否则会报错如下: Failed with exception MetaExce...

  • hive回顾

    内部表,外部表,分区,分桶, ddl,dml 分区导入,复杂查询(join,group by ),内置函数 文本处...

  • scadb系列--scadb支持的SQL语句

    一、DDL语法: 1. 创建表: 分区表: 非分区表: 2. 删除表 3. 修改表 二、DML语法: 插入: 更新...

  • 2018-06-14

    1.来来来谈谈你们自认为零基础班hive要掌握哪些东西? 编译 搭建 DDL DML 动态分区 静态分区 函数...

  • 20180614早课记录31-Sqoop

    1.来来来谈谈你们自认为零基础班hive要掌握哪些东西? 编译 搭建 DDL DML 动态分区 静态分区 函数 ...

  • 2021-02-03 HiveSQL:DDL和DML

    一、DDLHive中的DDL和MySQL中基本一致。 1.数据库的操作 2.表的操作2.1创建表相较于MySQL,...

  • ODPS开发笔记

    数据定义语言(DDL SQL) ODPS视图操作 数据操作语言(DML SQL) 动态分区 在insert ove...

  • 096-BigData-24Hive查询排序分桶

    上一篇:095-BigData-23Hive分区及DML操作 六、查询 官方资料之查询(select) 6.1 基...

  • HiveSQL优化方法与实践(转载)

    前言 昨天我们已分享过一篇高质量HiveSQL优化的文章:HiveSQL优化方法与实践[http://mp.wei...

网友评论

      本文标题:HiveSQL分区-DML

      本文链接:https://www.haomeiwen.com/subject/bbhggftx.html