大数据文件格式梳理：Parquet、Avro、ORC

大数据文件格式梳理：Parquet、Avro、ORC

作者: ryancao_b9b9 | 来源:发表于2019-04-30 16:32 被阅读0次

大数据文件格式梳理：Parquet、Avro、ORC
【2019-03-04】大数据常见存储格式对比
Hive表支持多种格式
CSV, JSON, AVRO,Parquet, and ORC
数据仓库-Hive基础（七） Hive 的压缩优化
python如何原生访问hdfs文件系统
ORC File
111.Parquet表的使用
将Avro数据转换为Parquet格式
avro源码阅读-写avro文件

一、相同点

1、基于Hadoop文件系统优化出的存储结构

2、提供高效的压缩

3、二进制存储格式

4、文件可分割，具有很强的伸缩性和并行处理能力

5、使用schema进行自我描述

6、属于线上格式，可以在Hadoop节点之间传递数据

二、不同点

行式存储or列式存储：Parquet和ORC都以列的形式存储数据，而Avro以基于行的格式存储数据。就其本质而言，面向列的数据存储针对读取繁重的分析工作负载进行了优化，而基于行的数据库最适合于大量写入的事务性工作负载。

压缩率：基于列的存储区Parquet和ORC提供的压缩率高于基于行的Avro格式。

可兼容的平台：

ORC常用于Hive、Presto；

Parquet常用于Impala、Drill、Spark、Arrow；

Avro常用于Kafka、Druid。

参考原文：https://blog.csdn.net/OiteBody/article/details/85055574

版权声明：本文为博主原创文章，转载请附上博文链接！

相关文章

大数据文件格式梳理：Parquet、Avro、ORC
一、相同点 1、基于Hadoop文件系统优化出的存储结构 2、提供高效的压缩 3、二进制存储格式 4、文件可分割，...
【2019-03-04】大数据常见存储格式对比
大纲大数据集中常见的存储格式:avro ，orc，parquet，他们主要区别是啥呢？ 1.主要特点 avro ...
Hive表支持多种格式
不同的分区有不同的数据存储格式（例如：parquet、json、avro、orc等）可以通过修改分区的格式实现。...
CSV, JSON, AVRO,Parquet, and ORC
CSV CSV文件（逗号分割不同列的值）常被使用普通文本格式的系统用作交换它们的表格数据。CSV是基于行的文件格式...
数据仓库-Hive基础（七） Hive 的压缩优化
压缩一般用orc或者parquet orc 结尾加上STORED AS orc，同理，用Parquet模式我们加...
python如何原生访问hdfs文件系统
对于HIVE，生成orc或者parquet文件格式放在hdfs文件系统上，对外通过SQL语句，就能实现离线分析，数...
ORC File
ORC 文件是在hive 0.11.0开始支持。 ORC 文件格式相对于其他的文件格式，ORC文件格式有以下优点...
111.Parquet表的使用
Parquet格式：数据模型: Avro, Thrift, Protocol Buffers, POJOs查询引擎...
将Avro数据转换为Parquet格式
本文主要测试将Avro数据转换为Parquet格式的过程并查看 Parquet 文件的 schema 和元数据。 ...
avro源码阅读-写avro文件
avro文件结构 avro文件格式大致如下（引用自avro官网Specification的Object Conta...

网友评论

本文标题：大数据文件格式梳理：Parquet、Avro、ORC

本文链接：https://www.haomeiwen.com/subject/ybmvnqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|大数据文件格式梳理：Parquet、Avro、ORC|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！