美文网首页
数据模型和数据存储格式

数据模型和数据存储格式

作者: 谢谢侬侬侬 | 来源:发表于2020-02-04 23:33 被阅读0次

以列式数据存储格式parquet介绍两者区别。

三个概念:

  1. 存储格式,是数据的二进制组织表示形式,如parquet

  2. 数据对象转换器,其任务是在外部对象模型和Parquet的内部数据类型之间进行映射。

  3. 对象模型,它们是数据的内存表示形式。AvroThriftProtocol BufferHivePig都是对象模型的示例。

三者关系用图表说明:


image.png

Avro,Thrift和Protocol Buffer都有自己的存储格式,但是Parquet不会以任何方式使用它们。而是将它们的对象映射到Parquet数据模型,parquet使用自己的文件格式进行序列化,所以parquet不能读取avor存储格式的数据。

让我们检查一下将Avro对象写入Parquet时会发生什么:


image.png

相关文章

  • 数据建模目的

    目的:有序、有结构的分类组织和存储 数据模型和表的区别: 数据模型是从业务、数据存储和使用角度合理存储数据 表就是...

  • 数据模型和数据存储格式

    以列式数据存储格式parquet介绍两者区别。 三个概念: 存储格式,是数据的二进制组织表示形式,如parquet...

  • 为什么需要数据建模?

    数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。有了适合业务和基础数据存储环境的模型...

  • 数据持久化之NSUserDefaults

    所谓的数据持久化、就是将内存中的数据模型转换为存储模型,以及将存储模型转换为内存中的数据模型的统称. 数据模型可以...

  • 数据持久化

    数据持久化(PO)就是将内存中的数据模型转换为存储模型,以及将存储模型转换为内存中的数据模型的统称.数据模型可以是...

  • 7.阿里大数据——大数据建模

    一、为什么需要数据建模 数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。适合业务和基...

  • 从0开始学大数据-数据仓库建模

    为什么要数据仓库建模 数据模型是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。有了适合业务和基...

  • 数据持久化之NSUserDefaults

    能将内存中的数据模型转换为存储模型,并能在将来需要时将存储模型还原为数据模型的机制。 NSUserDefaults...

  • CoreData(二)---创建stack

    1.Core Data classes NSManagedObjectModel:用来创建数据模型,存储属性和保存...

  • 中级iOS开发面试题汇总

    1:MVC的理解 MVC设计模式考虑三种对象:数据模型对象,视图对象和控制器对象。 数据模型:负责存储、定义、操作...

网友评论

      本文标题:数据模型和数据存储格式

      本文链接:https://www.haomeiwen.com/subject/mkcjxhtx.html