美文网首页
Hive中的常用函数

Hive中的常用函数

作者: 数据人阿多 | 来源:发表于2022-08-11 18:22 被阅读0次

背景

现阶段各个公司的数据慢慢的增多,很多数据都是存放在基于Hadoop的集群上,数据的查询一般使用的是hive,很多公司的数据中台也是使用hive来进行数据处理,本篇文章就来分享下在hive中常用的函数

常用函数

set类设置

  • 查询结果显示表头
    set hive.cli.print.header=true;
  • 设置Fetch抓取,不走job
    set hive.fetch.task.conversion=more;
  • 展示数据库
    set hive.cli.print.current.db=true;
  • 修改是否使用静默
    set hive.compute.query.using.stats=false;


    日期类函数
  • 当天
select current_date()
运行结果:'2022-08-11'
  • 当月第一天
select trunc(current_date(),'MM')      
运行结果:'2022-08-01'
select date_format(to_date(trunc(current_date(),'MM')),"yyyyMMdd") 
运行结果:'20220801'
  • 当月最后一天
select last_day(current_date)  
运行结果:'2022-08-31'
  • 上个月
select date_format(add_months(CURRENT_DATE,-1),'yyyyMM')
运行结果:'202207'
  • 周几
select pmod(datediff(current_date(),'1900-01-08'),7)+1
运行结果:'4'
  • 获取当前时间戳
select unix_timestamp()
运行结果:'1660212154'



字符串类函数

  • 字符拼接
--concat(参数1,参数2,...参数n)
select concat('a','b','c')
运行结果:'abc'

select concat('a','b',null,'c')   --包含一个null的话,结果为null
运行结果:NULL
  • 字符以分割符进行拼接
--concat_ws(分隔符,参数1,参数2,...参数n)
select concat_ws(',','a','b','c')
运行结果:'a,b,c'

select concat_ws(',','a',null,'c')   --会忽略null
运行结果:'a,c'

select concat_ws(',',null,null,null)  --返回空字符,而不是null
运行结果:''



窗口类函数

  • ROW_NUMBER() –从1开始,按照顺序,生成分组内记录的序列

  • RANK() 生成数据项在分组中的排名,排名相等会在名次中留下空位

  • DENSE_RANK() 生成数据项在分组中的排名,排名相等会在名次中不会留下空位

  • LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值
    第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)

  • LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值
    第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)

更多窗口函数可参考
《Hive分析函数系列文章》
http://lxw1234.com/archives/2015/07/367.htm

历史相关文章


以上是自己实践中遇到的一些问题,分享出来供大家参考学习,欢迎关注微信公众号:DataShare ,不定期分享干货

相关文章

  • Hive中的常用函数

    背景 现阶段各个公司的数据慢慢的增多,很多数据都是存放在基于Hadoop的集群上,数据的查询一般使用的是hive,...

  • Hive sql常见操作

    基本sql操作 hive表操作 分区操作 Hive内置函数 (1)数学函数 常用的数学函数都有:round、flo...

  • PySpark操作Hive的常用语句函数封装包

    目的:将hive常用的查看函数进行封装。

  • SQL常用函数(自用)

    扩展: SQL中常用的函数, 这些函数 与 Hive中的函数, 80%以上, 都是一样的, 现在掌握了, 学Hiv...

  • Hive函数笔记--常用函数解析

    前言 本文不定期更新,记录工作中接触使用过的Hive函数 常用函数 get_json_object(string ...

  • Hive常用函数

    1 常见本地文件: 2 上传到hdfs上: 3 下载到指定目录: 4 创建外部表: 5 加载hdfs文件: 加载本...

  • Hive常用函数

    时间函数 数学函数 round 四舍五入((42.3 =>42)) ceil 向上取整(42.3 =>43) fl...

  • hive 常用函数

    问题 1.分组计算各个月的绩效加上总计cuberollupgroup by + union 2.最优差集((max...

  • hive常用函数

    关系运算 1、等值比较: = 语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;...

  • Hive常用函数

    一、窗口函数 1、窗口函数基础结构 窗口函数 = 分析函数 + over函数分析函数:sum ( )、max ( ...

网友评论

      本文标题:Hive中的常用函数

      本文链接:https://www.haomeiwen.com/subject/uoewwrtx.html