Hive学习-Hive基本操作（function、udf）

Hive学习-Hive基本操作（function、udf）

作者: 刘子栋 | 来源:发表于2018-06-14 15:40 被阅读0次

Hive学习-Hive基本操作（function、udf）
Hive从入门到精通8：Hive自定义函数（UDF）
hive中UDF和UDAF使用说明
Hive开发自定义函数UDF
学习中的关键的问题
hive-1.2.1自定义函数UDF、UDTF
java读取hive的orc文件
Hive相关文章索引（1）
HIVE如何创建UDF和UDAF
HIVE

该篇主要是为了整理常用的function使用和开发自定义function的，hive虽说语法类似于mysql，但是mysql默认的dual表并不存在，需要自己手动创建一下，为了方便测试：

hive>create table dual(x string);

hive>insert into dual values('');

1、查询function列表

hive> show functions;

2、查询制定function的详细说明

3、upper、lower大小写转换

4、unix_timestamp获取制定时间毫秒数，默认是当前时间戳

5、current_date查看当前日期

6、current_timestamp查看当前时间戳

7、to_date字符串转成日期，必须是标准格式

8、year、month、day

9、from_unixtime将long类型转换为时间，可以指定格式

10、substr/substring字符串截取

11、concat字符串连接

12、concat_ws将字符串用指定分隔符连接

13、split分割字符串，根据指定字符分割字符串，分割字符可以是正则表达式

14、explode把数组或者map转成列，posexplode同explode，但会额外增加一列标识转化列所处数组的位置

现存在如下表：

要求计算该表中的单词出现的频率，即mr的wordcount示例

实现SQL如下，实现过程就是先用split分割，然后用explode转化，再作为临时表查询，拓展一下如果单词分割不仅仅只有逗号，或者空格、引号等可以用正则表达式实现或者用多重split。经过看官网的介绍，还有一个黑科技（sentences方法），能直接根据语言习惯自动分割成单词：

15、json_tuple解析json字符串

现在存在如下表：

要求按照格式userid，movie，rate，time，year，month，day，hour，minute，ts并按照月份写到分区表中。实现过程如下：

建表：

hive> create table movie(userid int,movie int,rate int,time string,year int,month int,day int,hour   int,minute int,ts timestamp)

   >partitioned by (m string)

   >row format delimited fields terminated by '/t';

数据写入，其中数据处理用到了字符串转bigint（cast），bigint转时间戳（from_unixtime），时间戳转字符串（date_format）：

校验：

表中数据

HDFS存储

16、row_number函数

分组排序使用

现有如下数据表：

需求：按年龄大小查出男和女最大年龄的两个

17、自定义UDF函数（临时）

idea新建maven项目

编辑pom.xml文件

1）修改打包类型，默认是war包，这里需要的是jar包

2）定义hive和hadoop的版本号，方便其他地方引用，因为用的是cdh版本的hadoop和hive，所以需要添加cdh的资源库

3）添加hadoop和hive的依赖

新建class继承org.apache.hadoop.hive.ql.udf.generic.GenericUDF类，方法如下：

打包

view-->Tool Windows-->Maven Project，双击package直接打包成jar文件

上传到linix，然后hive下执行以下命令：

hive> add jar /home/hadoop/lib/hive-1.0.jar;

hive> CREATE TEMPORARY FUNCTION calculateStringsLength as 'com.ruozedata.HelloUDF';

测试：

18、自定义UDF函数（永久）

$ hdfs dfs -mkdir /lib

$ hdfs dfs -put hive-1.0.jar /lib/

相关文章

Hive学习-Hive基本操作（function、udf）
该篇主要是为了整理常用的function使用和开发自定义function的，hive虽说语法类似于mysql，但是...
Hive从入门到精通8：Hive自定义函数（UDF）
1.什么是Hive UDF？ Hive中的用户自定义函数（即User Defined Function，简称UDF...
hive中UDF和UDAF使用说明
Hive进行UDF开发十分简单，此处所说UDF为Temporary的function，所以需要hive版本在0.4...
Hive开发自定义函数UDF
Hive 内置函数 Hive自定义函数 UDF(User-Defined-Function) 一进一出 UDAF(...
学习中的关键的问题
hive中的topn操作需要使用到hive的窗口函数执行操作的。 spark的udf可以实现自定义的udf的函数的...
hive-1.2.1自定义函数UDF、UDTF
Hive中有三种UDF: 1、用户定义函数(user-defined function)UDF； 2、用户定义聚集...
java读取hive的orc文件
hive API2hive udf 读取HDFS的orc文件
Hive相关文章索引（1）
基本常识 Hive的UDF实现详解 hive 中日志的存放位置默认存储与 /tmp/{user.name}目录下...
HIVE如何创建UDF和UDAF
UDF和UDAF简介 UDF udf 是hive function 是传入某一行的一个或者多个字段，然后返回一个v...
HIVE
基本操作 hive进入hive模式 exit; 退出hive模式展示正则匹配表名hive> use ad_s...

网友评论

本文标题：Hive学习-Hive基本操作（function、udf）

本文链接：https://www.haomeiwen.com/subject/kvvdeftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Hive学习-Hive基本操作（function、udf）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！