Avro JSON 序列化

Avro JSON 序列化

作者: 神农民 | 来源:发表于2016-12-06 00:38 被阅读517次

Avro JSON 序列化
记一次Avro序列化bug
Apache Avro
Avro
Hadoop权威指南-ch4 Hadoop的I/O(3) Avr
Avro 对象序列化与反序列化,及转Json对象序列化处理
Apache Avro是什么干什么用的(RPC/序列化)
062 Python语法之Json介绍
关于avro
131.Avro格式数据与在spark中应用

摘要

Schema究竟是什么，Avro和JSON的关系，Avro的序列化与反序列化，对象容器文件。

Schema究竟是什么？

从Apache Avro简介中并不能确切的理解schema究竟是什么。通过阅读官方文档，总结如下：

schema是一种metadata（元数据，是用于描述数据的数据），用于描述avro数据；

schema通过JSON定义，下面是一个record类型的schema：

{
    "type": "record",
    "name": "test",
    "fields" : [
        {"name": "a", "type": "long"},
        {"name": "b", "type": "string"}
    ]
}

解析avro数据（来自对象容器文件或序列化数据）时，必须根据数据的schema进行分析；

通常，schema和其描述的数据一起存放，例如：在avro支持的对象容器文件(Object Container File)中就在头部包含了文件中存储的数据的schema；在RPC应用中，通信双方也必须确保拥有对方所发送数据的schema。

Avro与JSON的类型映射

Avro数据的序列化和反序列化

Avro指定两种序列化方法：

二进制：更小、更快，用于大部分应用中；
JSON：易读，常用于调试和基于web的应用中；

序列化原则：深度优先、从左到右。

序列化之后的数据，可以通过反序列化而得到原数据(首先获取schema是必须的)。

对象容器文件(Object Container File)

对象容器文件是avro定义的一种文件格式。包含如下内容：

Four bytes, ASCII 'O', 'b', 'j', followed by 1.
file metadata, including the schema.
The 16-byte, randomly-generated sync marker for this file.
one or more file data blocks.

注意：

文件中存储的所有数据必须对应于头部的schema(avro.schema)；
所有数据必须采用二进制序列化；
存储的数据可以压缩(deflate)，也可以不压缩(null)；

JSON与Avro可以互转吗？

可以！参考序列化和反序列化。

相关链接

阅读原文 | 作者官网 | 公众号 | Feed | 订阅 | 发私信

相关文章

Avro JSON 序列化
摘要 Schema究竟是什么，Avro和JSON的关系，Avro的序列化与反序列化，对象容器文件。 Schema究...
记一次Avro序列化bug
bug描述 Avro 序列化 Event长度超过63后反序列化失败问题定位 1.程序中将avro序列化后的by...
Apache Avro
Apache Avro是一个数据序列化框架，它通过定义json风格的schema文件来表示数据的格式 maven依...
Avro
Avro[http://avro.apache.org/]是一种与编程语言无关的序列化格式，Avro 数据通过与语...
Hadoop权威指南-ch4 Hadoop的I/O(3) Avr
注：本文涉及书中4.4小结数据序列化系统Avro Apache Avro是一个独立于编程语言的数据序列化系统，旨...
Avro 对象序列化与反序列化,及转Json对象序列化处理
Avro 工具类序列化与反序列化 public class AvroHelper { public byte[]...
Apache Avro是什么干什么用的(RPC/序列化)
Avro总结(RPC/序列化) Avro是一个数据序列化系统，设计用于支持大批量数据交换的应用。它的主要特点有：...
062 Python语法之Json介绍
json局限 json不能序列化方法 json序列化 json反序列化
关于avro
关于avro 1、avro是一个独立于编程语言的数据序列化系统。该项目由Doug cutting Hadoop之父...
131.Avro格式数据与在spark中应用
Apache Avro 是一个数据序列化系统，Avro提供Java、Python、C、C++、C#等语言API接口...

网友评论

本文标题：Avro JSON 序列化

本文链接：https://www.haomeiwen.com/subject/zhilmttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Avro JSON 序列化|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！