美文网首页
数据仓库-Hive基础(七) Hive 的压缩优化

数据仓库-Hive基础(七) Hive 的压缩优化

作者: 做个合格的大厂程序员 | 来源:发表于2020-06-23 17:53 被阅读0次

压缩

一般用orc或者parquet

orc

create table log_orc( 
track_time string, 
url string, 
session_id string, 
referer string, 
ip string, 
end_user_id string, 
city_id string ) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' 
STORED AS orc ;

结尾加上STORED AS orc,同理,用Parquet模式我们加上STORED AS PARQUET ;

ORC存储指定压缩方式

create table log_orc_snappy( 
track_time string, 
url string, 
session_id string, 
referer string, 
ip string,
 end_user_id string, 
 city_id string ) 
 ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
 STORED AS orc 
tblproperties ("orc.compress"="SNAPPY");

一般SNAPPY压缩和解压缩比比较高,所以一般如果压缩就用snappy,结尾加上tblproperties ("orc.compress"="SNAPPY");即可

存储方式和压缩总结

在实际的项目开发当中,hive表的数据存储格式一般选择:orc或parquet。压缩方式一般选 择snappy。

相关文章

  • 数据仓库-Hive基础(七) Hive 的压缩优化

    压缩 一般用orc或者parquet orc 结尾加上STORED AS orc,同理,用Parquet模式我们加...

  • HIVE

    --------hive 数据仓库 hive底层执行引擎有 MapReduce Tez Spark 压缩 GZI...

  • 无标题文章

    Hive 学习笔记 学习笔记 Hive 简介 Hive 是建立在 Hadoop 上的数据仓库基础构架,可以用来进行...

  • hive 优化方案

    目前越来越多的公司开始基于Hive搭建数据仓库,所以本文主要针对Hive介绍几种优化方式。尽管Hive已经做了很多...

  • <官网学大数据>Hive

    Hive简介 Hive是简历在Hadoop HDFS上的数据仓库基础架构 Hive可以用来进行数据提取转化加载(E...

  • hive积累大全

    此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程SQL中的if表达式用法...

  • 数据仓库-Hive基础(六) Hive 查询语法

    数据仓库-Hive基础(六) Hive 查询语法 SELECT order by 会对输入做全局排序,因此只有一个...

  • 数据仓库组件:Hive环境搭建和基础用法

    一、Hive基础简介 1、基础描述 Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,是...

  • 数据库技术对比 MYSQL/hive/PG/Oracle

    [toc] Hive 简介 Hive是建立在 Hadoop 上的数据仓库基础构架,起源于Facebook(一个美国...

  • Hive简介

    简述 数据仓库 Hive的体现结构 (支持mysql derby oracle) Hive 的安装 Hive的管理...

网友评论

      本文标题:数据仓库-Hive基础(七) Hive 的压缩优化

      本文链接:https://www.haomeiwen.com/subject/wwghfktx.html