美文网首页
Hadoop开发--Hive内置运算符

Hadoop开发--Hive内置运算符

作者: 无剑_君 | 来源:发表于2019-12-18 15:23 被阅读0次

    示例数据


    1. 员工表:emp
      字段
      empno :员工编号
      ename :员工姓名
      job :职位
      mgr :上级
      hiredate :入职日期
      sal :工资
      comm :奖金
      deptno :部门编号
    create table IF NOT EXISTS emp(
    empno int,
    ename string,
    job string,
    mgr int,
    hiredate string,
    sal double,
    comm double,
    deptno int
    )
    ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' stored as textfile;
    

    部门表:
    字段
    deptno :部门编号
    dname :部门名称
    loc :地址

    create table IF NOT EXISTS default.dept(
    deptno int,
    dname string,
    loc string
    )
    ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';
    
    1. 数据
      员工数据:
    7499    ALLEN   SALESMAN    7698    1981-02-20  1600.0  300.0   30
    7521    WARD    SALESMAN    7698    1981-02-22  1250.0  500.0   30
    7566    JONES   MANAGER     7839    1981-04-02  2975.0  0.0     20
    7654    MARTIN  SALESMAN    7698    1981-09-28  1250.0  1400.0  30
    7698    BLAKE   MANAGER     7839    1981-05-01  2850.0  0.0     30
    7782    CLARK   MANAGER     7839    1981-06-09  2450.0  0.0     10
    7788    SCOTT   ANALYST     7566    1987-07-13  3000.0  0.0     20
    7839    KING    PRESIDENT   NULL    1981-11-07  5000.0  0.0     10
    7844    TURNER  SALESMAN    7698    1981-09-08  1500.0  0.0     30
    7876    ADAMS   CLERK       7788    1987-07-13  1100.0  0.0     20
    7900    JAMES   CLERK       7698    1981-12-03  950.0   0.0     30
    7902    FORD    ANALYST     7566    1981-12-03  3000.0  0.0     20
    7934    MILLER  CLERK       7782    1982-01-23  1300.0  0.0     10
    

    部门数据:

    10  ACCOUNTING  NEW YORK
    20  RESEARCH    DALLAS
    30  SALES       CHICAGO
    40  OPERATIONS  BOSTON
    
    1. 加载数据
    # 加载员工数据
    load data local inpath '/root/empdata'  overwrite into table emp;
    # 加载部门数据
    load data local inpath '/root/deptdata' overwrite into table dept ;
    
    

    一、算术运算符

    这些运算符支持的操作数各种常见的算术运算。所有这些返回数字类型。下表描述了在Hive中可用的算术运算符:

    运算符 操作 描述
    A + B 所有数字类型 A加B的结果
    A - B 所有数字类型 A减去B的结果
    A * B 所有数字类型 A乘以B的结果
    A / B 所有数字类型 A除以B的结果
    A % B 所有数字类型 A除以B.产生的余数
    A & B 所有数字类型 A和B的按位与结果
    A | B 所有数字类型 A和B的按位或结果
    A ^ B 所有数字类型 A和B的按位异或结果
    ~A 所有数字类型 A按位非的结果

    示例

    下面的查询相加两个数字,20和30。

    hive> SELECT 20+30 ADD FROM temp;
    

    在成功执行查询后,能看到以下回应:

    +--------+
    |   ADD  |
    +--------+
    |   50   |
    +--------+
    

    二、关系运算符

    运算符 操作 描述
    A = B 所有基本类型 如果表达A等于表达B,结果TRUE ,否则FALSE。
    A != B 所有基本类型 如果A不等于表达式B表达返回TRUE ,否则FALSE。
    A < B 所有基本类型 TRUE,如果表达式A小于表达式B,否则FALSE。
    A <= B 所有基本类型 TRUE,如果表达式A小于或等于表达式B,否则FALSE。
    A > B 所有基本类型 TRUE,如果表达式A大于表达式B,否则FALSE。
    A >= B 所有基本类型 TRUE,如果表达式A大于或等于表达式B,否则FALSE。
    <>
    A IS NULL 所有类型 TRUE,如果表达式的计算结果为NULL,否则FALSE。
    A IS NOT NULL 所有类型 FALSE,如果表达式A的计算结果为NULL,否则TRUE。
    A LIKE B 字符串 TRUE,如果字符串模式A匹配到B,否则FALSE。
    A RLIKE B 字符串 NULL,如果A或B为NULL;TRUE,如果A任何子字符串匹配Java正则表达式B;否则FALSE。
    A REGEXP B 字符串 等同于RLIKE.

    示例:
    我们假设employee表由字段:Id, Name, Salary, Designation, 和Dept组成,个查询检索员工详细信息 - ID为1205。

    +-----+--------------+--------+---------------------------+------+
    | Id  | Name         | Salary | Designation               | Dept |
    +-----+--------------+------------------------------------+------+
    |1201 | Gopal        | 45000  | Technical manager         | TP   |
    |1202 | Manisha      | 45000  | Proofreader               | PR   |
    |1203 | Masthanvali  | 40000  | Technical writer          | TP   |
    |1204 | Krian        | 40000  | Hr Admin                  | HR   |
    |1205 | Kranthi      | 30000  | Op Admin                  | Admin|
    +-----+--------------+--------+---------------------------+------+
    

    以下查询执行检索使用上述表中的雇员的详细信息:

    hive> SELECT * FROM employee WHERE Id=1205;
    

    查询执行以检索薪水大于或等于40000卢比的雇员的详细信息。

    hive> SELECT * FROM employee WHERE Salary>=40000;
    

    NULL

    hive> select 1 from dual where null is null;
    hive> select 1 from dual where null is not null;
    

    LIKE

     '%
     _
    

    RLIKE
    A RLIKE B ,表示B是否在A里面即可。而A LIKE B,则表示B是否是A.

    0: jdbc:hive2://192.168.71.130:10000>  select 'footbar' rlike '^f..]+r$';
    OK
    +--------+
    |  _c0   |
    +--------+
    | false  |
    +--------+
    1 row selected (1.834 seconds)
    0: jdbc:hive2://192.168.71.130:10000> select 'footbar' rlike '^f.*r$';
    OK
    +-------+
    |  _c0  |
    +-------+
    | true  |
    +-------+
    
    

    三、逻辑运算符

    运算符是逻辑表达式。所有这些返回TRUE或FALSE。

    运算符 操作 描述
    A AND B boolean TRUE,如果A和B都是TRUE,否则FALSE。
    A && B boolean 类似于 A AND B.
    A OR B boolean TRUE,如果A或B或两者都是TRUE,否则FALSE。
    A || B boolean 类似于 A OR B.
    NOT A boolean TRUE,如果A是FALSE,否则FALSE。
    !A boolean 类似于 NOT A.

    下面的查询用于检索部门是TP并且工资超过40000卢比的员工详细信息。

    hive> SELECT * FROM employee WHERE Salary>40000 && Dept=TP;
    

    成功执行查询后,能看到以下回应:

    +------+--------------+-------------+-------------------+--------+
    | ID   | Name         | Salary      | Designation       | Dept   |
    +------+--------------+-------------+-------------------+--------+
    |1201  | Gopal        | 45000       | Technical manager | TP     |
    +------+--------------+-------------+-------------------+--------+
    

    通过参数hive.cli.print.header可以控制在cli中是否显示表的列名。

    set hive.cli.print.header=true;
    

    and or 优先级
    数据:

    id 员工编号 
    money 工资
    type 表示
    

    求编号1001与1002,工资等于100的记录。

    select id,money
    from winfunc
    where id='1001' or id='1002' and
    money ='100'
    

    四、复杂的运算符

    这些运算符提供一个表达式来接入复杂类型的元素。

    运算符 操作 描述
    A[n] A是一个数组,n是一个int 它返回数组A的第n个元素,第一个元素的索引0。
    hive> select t[0] from udftest;
    

    M[key] M 是一个 Map<K, V> 并 key 的类型为K 它返回对应于映射中关键字的值。

    hive> select t['100'] from udftest;
    

    S.x S是一个结构 它返回S的s字段

    创建表--使用map函数

    hive> create table udftest as select map('100', 'tom', '200', 'mary') as t from dual;
    

    查看表:

    hive> select t from udftest;
    

    相关文章

      网友评论

          本文标题:Hadoop开发--Hive内置运算符

          本文链接:https://www.haomeiwen.com/subject/cjnsnctx.html