美文网首页
19-Hive函数

19-Hive函数

作者: CrUelAnGElPG | 来源:发表于2018-06-10 15:23 被阅读0次

explode

create table hive_wc(sentence string);

load data local inpath '/home/hadoop/data/hive-wc.txt' into table hive_wc;

hello,world,welcome

hello,welcome

求每个单词出现的个数

1) 获取每个单词  split(sentence,",")

["hello","world","welcome"]

["hello","welcome"]

"hello"

"world"

"welcome"

"hello"

"welcome"

select word, count(1) as c

from (select explode(split(sentence,",")) as word from hive_wc) t

group by word ;

json

create table rating_json(json string);

load data local inpath '/home/hadoop/data/rating.json' into table rating_json;

select

json_tuple(json,"movie","rate","time","userid") as (movie,rate,time,userid)

from rating_json limit 10;

create table hive_rownumber(id int,age int, name string, sex string)

row format delimited fields terminated by ',';

load data local inpath '/home/hadoop/data/hive_row_number.txt' into table hive_rownumber;

查询出每种性别中年龄最大的2条数据 ==> topn

select * from hive_rownumber

group by sex order by age limit 2;

order by是全局的排序,是做不到分组内的排序的!!!

分析函数

select id,age,name,sex

from

(select id,age,name,sex,

row_number() over(partition by sex order by age desc) as rank

from hive_rownumber) t

where rank<=2;

User-Defined Functions : UDF

UDF: 一进一出  upper  lower substring

UDAF:Aggregation  多进一出  count max min sum ...

UDTF: Table-Generation  一进多出

IDEA + Maven

功能:输入xxx,输出Hello xxx

自定义UDF函数的步骤

1) 定义一个类 extends UDF

add jar /home/hadoop/lib/hive-1.0.jar;

CREATE TEMPORARY FUNCTION sayHello AS 'com.ruozedata.bigdata.HelloUDF';

TEMPORARY:仅对当前session(黑窗口)有效

CREATE FUNCTION sayRuozeHello AS 'com.ruozedata.bigdata.HelloUDF'

USING JAR 'hdfs://hadoop000:8020/lib/hive-1.0.jar';

源码面前,了无秘密

相关文章

  • 19-Hive函数

    explode create table hive_wc(sentence string); load data ...

  • 大数据开发之Hive篇19-Hive分区表详解

    备注:Hive 版本 2.1.1 一.Hive分区表概述 数据分区的概念以及存在很久了,通常使用分区来水平分散压力...

  • Excel(三)

    AND函数 OR函数 NOT函数 IF函数 频率分析函数FREQUENCY

  • if、else if、for、while、repeat函数

    ①if函数 ②else if函数 ③for函数 ④while函数 ⑤repeat函数

  • strsplit、mapply、paste、match函数

    strsplit函数 mapply函数 strsplit函数 mapply函数 paste函数 match函数 第...

  • Oracle中常用函数(SQL)

    Oracle函授有以下几个分类:数字函数、字符函数、日期函数、转换函数、集合函数、分析函数 数字函数: 字符函数:...

  • MySQL函数

    字符函数 数字运算函数 比较运算符和函数 日期时间函数 信息函数 聚合函数 加密函数 流程函数

  • BI-SQL丨AND & OR & IN

    AND函数 & OR函数 & IN函数 AND函数、OR函数和IN函数都可以理解是WHERE函数的补充,当然也可以...

  • Python之函数

    课程大纲 函数定义 函数的参数 函数的返回值 高阶函数 函数作用域 递归函数 匿名函数 内置函数 函数式编程 将函...

  • 函数基本知识

    函数 函数的定义: def 函数名() 函数的调用:函数名() #不能将函数调用放在函数定义上方 函数的文档注...

网友评论

      本文标题:19-Hive函数

      本文链接:https://www.haomeiwen.com/subject/lpnfeftx.html