美文网首页Hive在简书玩转大数据大数据,机器学习,人工智能
Hive扩展功能(九)--Hive的行级更新操作(Update)

Hive扩展功能(九)--Hive的行级更新操作(Update)

作者: 咸鱼翻身记 | 来源:发表于2017-02-16 18:58 被阅读330次

软件环境:

linux系统: CentOS6.7
Hadoop版本: 2.6.5
zookeeper版本: 3.4.8

</br>

主机配置:

一共m1, m2, m3这三部机, 每部主机的用户名都为centos
192.168.179.201: m1 
192.168.179.202: m2 
192.168.179.203: m3 

m1: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Master, Worker
m2: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Worker
m3: Zookeeper, DataNode, NodeManager, Worker

资料:

官方资料:
    Update资料  <=>      https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML
    Join资料    <=>      https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins
网上参考资料:
    Update资料  <=>      http://www.aboutyun.com/thread-12155-1-1.html

</br>

一.为Hive配置Update功能

1.编辑hive-site.xml文件:
<property>
    <name>hive.optimize.sort.dynamic.partition</name>
    <value>false</value>
</property>
<property>
    <name>hive.support.concurrency</name>
    <value>true</value>
</property>
<property>
    <name>hive.enforce.bucketing</name>
    <value>true</value>
</property>
<property>
    <name>hive.exec.dynamic.partition.mode</name>
    <value>nonstrict</value>
</property>
<property>
    <name>hive.txn.manager</name>
    <value>org.apache.hadoop.hive.ql.lockmgr.DbTxnManager</value>
</property>
<property>
    <name>hive.compactor.initiator.on</name>
    <value>true</value>
</property>
<property>
    <name>hive.compactor.worker.threads</name>
    <value>1</value>
</property>
<property>
    <name>hive.in.test</name>
    <value>true</value>
</property>

</br>

二.Update语法

1.创表语句

Hive对使用Update功能的表有特定的语法要求, 语法要求如下:

  1. 要执行Update的表中, 建表时必须带有buckets(分桶)属性
  2. 要执行Update的表中, 需要指定格式,其余格式目前赞不支持, 如:parquet格式, 目前只支持ORCFileformat和AcidOutputFormat
  3. 要执行Update的表中, 建表时必须指定参数('transactional' = true);
    举例:
create table student (id bigint,name string) clustered by (name) into 2 buckets stored as orc TBLPROPERTIES('transactional'='true');

2.更新语句:
update student set id='444' where name='tom';

</br>
</br>
</br>

相关文章

  • Hive扩展功能(九)--Hive的行级更新操作(Update)

    软件环境: 主机配置: 一共m1, m2, m3这三部机, 每部主机的用户名都为centos 资料: 一.为Hiv...

  • 2.HiveQL:数据定义

    HiveQL和SQL的区别 1.hive不支持行级插入操作,更新操作和删除操作。hive也不支持事务。 1.创建数...

  • HIVE行级更新操作配置

    在hive上执行事务操作(增删改查)是hive从0.14版本就支持,但并不是默认支持,需要修改参数,如果不修改参数...

  • 数据查询-Hive基础

    outline 什么是Hive 为什么需要Hive Hive的架构 Hive的常用操作 什么是Hive Hive由...

  • hive基础语法

    目录 Hive安装和启动 Hive表操作-分区表 Hive表操作-复杂类型操作 Hive 查询语句 Zepplin...

  • Hive扩展功能(七)--Hive On Spark

    软件环境: 主机配置: 一共m1, m2, m3这三部机, 每部主机的用户名都为centos 参考资料: 说明: ...

  • Hive中的msck和analyze table的作用

    0. Hive使用中遇到的问题 Hive是常用的数据仓库工具,功能强大,操作简便。在使用Hive的过程中,经常碰见...

  • Hive- UDF&GenericUDF

    hive udf简介 在Hive中,用户可以自定义一些函数,用于扩展HiveQL的功能,而这类函数叫做UDF(用户...

  • Hive 钩子函数示例

    hive 原生自带钩子(hook)功能,以实现类似于“插件”的机制。 当 hive 进行很多操作时,可以调用外部由...

  • HIVE

    基本操作 hive进入hive模式 exit; 退出hive模式 展示正则匹配表名hive> use ad_s...

网友评论

    本文标题:Hive扩展功能(九)--Hive的行级更新操作(Update)

    本文链接:https://www.haomeiwen.com/subject/mcyhwttx.html