美文网首页
Hive 系列 - 常用函数

Hive 系列 - 常用函数

作者: Rex_2013 | 来源:发表于2020-11-02 09:08 被阅读0次

1系统内置函数

1.查看系统自带的函数

hive> show functions;

2.显示自带的函数的用法

hive> desc function upper;

3.详细显示自带的函数的用法

hive> desc function extended upper;

2 自定义函数

  1. Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。

  2. 当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)。

  3. 根据用户自定义函数类别分为以下三种:

    1. UDF(User-Defined-Function) 一进一出
    2. UDAF(User-Defined Aggregation Function) 聚集函数,多进一出 类似于:count/max/min
    3. UDTF(User-Defined Table-Generating Functions) 一进多出 如lateral view explore()
  4. 编程步骤:

    1. 继承org.apache.hadoop.hive.ql.UDF

    2. 需要实现evaluate函数;evaluate函数支持重载;

    3. 在hive的命令行窗口创建函数

      add jar linux_jar_path
      create [temporary] function [dbname.]function_name AS class_name;
      
    4. 在hive的命令行窗口删除函数

      Drop [temporary] function [if exists] [dbname.]function_name;
      
  5. 注意事项

    UDF必须要有返回类型,可以返回null,但是返回类型不能为void;

3 自定义UDF函数

  1. 创建一个Maven工程Hive

  2. 导入依赖

    <dependencies>
         <!-- https://mvnrepository.com/artifact/org.apache.hive/hive-exec -->
         <dependency>
             <groupId>org.apache.hive</groupId>
             <artifactId>hive-exec</artifactId>
             <version>1.2.1</version>
         </dependency>
    </dependencies>
    
  3. 创建一个类

    package com.rex.hive;
    import org.apache.hadoop.hive.ql.exec.UDF;
    
    public class Lower extends UDF {
    
     public String evaluate (final String s) {
         
         if (s == null) {
             return null;
         }
         
         return s.toLowerCase();
     }
    }
    
  4. 打成jar包上传到服务器/opt/module/jars/udf.jar

  5. 将jar包添加到hive的classpath

    hive (default)> add jar /opt/module/datas/udf.jar;
    
  6. 创建临时函数与开发好的java class关联

    hive (default)> create temporary function mylower as "com.rex.hive.Lower";
    
  7. 即可在hql中使用自定义的函数strip

    hive (default)> select ename, mylower(ename) lowername from emp;
    

相关文章

  • Hive 系列 - 常用函数

    1系统内置函数 1.查看系统自带的函数 2.显示自带的函数的用法 3.详细显示自带的函数的用法 2 自定义函数 H...

  • Hive sql常见操作

    基本sql操作 hive表操作 分区操作 Hive内置函数 (1)数学函数 常用的数学函数都有:round、flo...

  • PySpark操作Hive的常用语句函数封装包

    目的:将hive常用的查看函数进行封装。

  • Hive常用函数

    1 常见本地文件: 2 上传到hdfs上: 3 下载到指定目录: 4 创建外部表: 5 加载hdfs文件: 加载本...

  • Hive常用函数

    时间函数 数学函数 round 四舍五入((42.3 =>42)) ceil 向上取整(42.3 =>43) fl...

  • hive 常用函数

    问题 1.分组计算各个月的绩效加上总计cuberollupgroup by + union 2.最优差集((max...

  • hive常用函数

    关系运算 1、等值比较: = 语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;...

  • Hive常用函数

    一、窗口函数 1、窗口函数基础结构 窗口函数 = 分析函数 + over函数分析函数:sum ( )、max ( ...

  • Hive常用函数

    一、关系运算: 1. 等值比较: = 举例:Hive>select 1 from lxw_dual where 1...

  • Hive常用函数

    if函数:格式: if( 判断条件, return true , return false )注意: if函数支...

网友评论

      本文标题:Hive 系列 - 常用函数

      本文链接:https://www.haomeiwen.com/subject/mvqlvktx.html