21.1Hive复习

21.1Hive复习

作者: 文茶君 | 来源:发表于2019-12-17 15:48 被阅读0次

21.1Hive复习
复习，复习，复习
复习复习再复习
复习复习再复习
复习，复习，再复习！
复习复习再复习
复习复习
复习复习
复习！复习！
复习复习

Hive

hive是数据仓库，用途：分析，决策类影响
hive搭建

注意，搭建是按照元数据的存储和管理进行搭建的
搭建方式
1）使用hive自带的内存数据库derby-------不用
2）使用单机的MySQL数据库，通过网络来访问元数据-----使用较多
3）使用远程元数据服务的方式，实现hive和关系型数据库的解耦-------使用较多
hive DDL
创建数据库create database databaseName
创建表
1)create table tablename(col dataType..)row format dilimited fields terminated by "collection items terminated by " map key terminated by "|serde(正则)
2)create table tablename as select as select_statement(数据和表结构都有)
3）create table tablename like tablename(只有表结构)
内部表和外部表
1）创建内部表不需要指定数据存储的路径，直接将数据存储在默认的目录中
外部表需要使用external关键字指定，需要使用location指定存储数据的位置
2）删除内部表的的数据和元数据都是由hive来管理的，删除的时候全部删除
外部表的数据由hdfs管理，元数据由hive管理，删除的时候只删除元数据，数据不会删除

DML
1）增
1.load data local inpath "overwrite/into table tablename(partition)
2.from.... insert overwrite/into tablename select..
3.insert into table values
4.insert into local directory dic... select-statement
1.2常用，3和4基本不用
2）使用删除和修改必须要经过事务，需要配置事务
限制（1）rollback，commit不支持
（2）必须是orc文件格式
（3）表必须被分桶
（4）默认事务是不开启的
hive的分区
目的：方便提高检索的效率
展现形式：在hdfs目录上创建多级目录
hive分区的分类
1)静态分区
在静态分区的值是人为指定
2）动态分区
分区列的值是由记录的某一列来决定的
3）添加分区（只适用于动态分区）
alter table tablename add partition(col=val)
4)修复分区
分区是作为元数据存储在MySQL中的，当hdfs路径中包含多级目录，同时存在分区列的时候，可以创建外部表使用，但是分区的元数据没有在MySQL中存储，查不到数据
msck repair table tablename
hive函数
1）hive本身自带了很多内嵌函数
字符函数数值函数日期函数复杂类型函数条件函数
2）函数的分类：udf一进一出
udaf 多进一出
udtf 一进多出
3）自定义函数
1编写java代码继承udf类
2.实现evaluate方法，所有实现的核心逻辑写到此方法中
3.将写好的代码打成jar包
4.将jar包上传到本地Linux或者hdfs
5.如果是本地Linux，在hive客户端执行add jar path
如果是hdfs
CREATE TEMPORARY FUNCTION add_example（jar包名name） AS 'hive.udf.Add'（package+class）;
6.如果是hdfs，直接创建函数
CREATE TEMPORARY FUNCTION func_name AS 'package+class' using 'jar在hdfs上的路径';

相关文章

21.1Hive复习
Hive hive是数据仓库，用途：分析，决策类影响hive搭建注意，搭建是按照元数据的存储和管理进行搭建的搭...
复习，复习，复习
复习，复习，复习老师让我今天就进行职业规划师初级证书的考试，我…… 总而言之，我给推到明天了。今天的文就是我的课...
复习复习再复习
安顿老师点评了我们的作业，同时告诉我们“很多人说，课程里学了很多知识，但是写的时候还是感觉憋不出来，下手...
复习复习再复习
复习复习再复习，默写默写再默写合同的效力一、合同的定义合同的效力又称合同的法律效力，是指已经成立的合同对合同...
复习，复习，再复习！
“日清-周结-月考”循环学习法日清，就是当天的学习任务当天完成，做到“三不”——“不等”、“不靠”、“不拖”，严...
复习复习再复习
距离考试只剩下不到十个小时了，回顾我这两天的复习，感觉什么都复习了，又感觉什么都没复习，可能一切都是心理作用。在...
复习复习
距离期末考试还有一天半的时间，距离回家还有两天的时间，然而我还没有复习完，小组的VRP 还没弄完，一直在修改，还有...
复习复习
这个学期快结束了，到校也快一个月了，复习的号角声也应该吹响。大早上看着图书馆门前一个个背着书包的身影，就...
复习！复习！
2018年过去了，我们迎来了2019年，当然，期末考试自然也向我们走来，瞧！最近我们大家都在认真复习着。每天早上我...
复习复习
函数，单射，双射，满射，数列的极限，函数极限，保号性，唯一性，有界性，无穷大无穷小，极限存在准则，有限个无穷小的和...

网友评论

本文标题：21.1Hive复习

本文链接：https://www.haomeiwen.com/subject/nbmsnctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|21.1Hive复习|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！