美文网首页
Hive 学习笔记

Hive 学习笔记

作者: 艾尔温 | 来源:发表于2016-12-01 15:35 被阅读0次

【文件存储格式】
在建表语句中通过" STORED AS FILE_FORMAT" 指定。

  • TEXTFILE:默认格式,数据不做压缩,磁盘开销大,数据解析开销大,结合Gzip/Bizp2使用,采用此种方式不支持对数据进行切分,从而无法实现数据的并行操作。
  • SEQUENCEFILE:Hadoop API提供的一种二进制文件,使用方便,支持数据切分与压缩。有三种压缩方式,NONE,RECORD(压缩率低)、BLOCK(推荐使用)。
  • RCFILE:一种行列存储相结合的方式。首先将数据按行分块,保证同一行记录在同一个块上;其次将块数据进行行列式存储,这样有利于数据压缩和快速的列存储。采用这种格式在数据加载时耗费的性能较大,但是具备较好的数据压缩比和查询响应,在一次写入多次读取的场景下推荐采用。
  • 自定义格式:当用户的数据文件格式不能被Hive识别时,通过实行InputFormat和OutputFormat来自定义输入输出格式。

相关文章

  • 无标题文章

    Hive 学习笔记 学习笔记 Hive 简介 Hive 是建立在 Hadoop 上的数据仓库基础构架,可以用来进行...

  • Hive 1.2.1 分区和分捅

    1. 借鉴 Hive学习笔记——Hive中的分桶Hive分区和分桶(0925)HIVE表索引,分区和分桶的区别 2...

  • Hive学习笔记

    hive简介 解释一:Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,...

  • Hive学习笔记

    本文是对Hive组件的学习的一个初步总结,包括如下章节的内容: Hive是什么 Hive安装 快速上手 Hive元...

  • Hive学习笔记

    Hive的作用 使用Hive QL (语法类似于SQL)做一些MapReducer能做的事情,但是他并不完全支持S...

  • Hive 学习笔记

    【文件存储格式】在建表语句中通过" STORED AS FILE_FORMAT" 指定。 TEXTFILE:默认格...

  • Hive学习笔记

    Hive的数据类型 array_type 数组类型 map_type map键值对类型 struct_ty...

  • Hive学习笔记

    1.建表语法: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_na...

  • hive学习笔记

    1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成为一张数据库表,...

  • Hive编程指南笔记整理

    hive编程指南阅读笔记 1.基础操作 1.1.启动hive HIVE_HOME$ bin/hive 1.2.1....

网友评论

      本文标题:Hive 学习笔记

      本文链接:https://www.haomeiwen.com/subject/maixmttx.html