美文网首页
Pig从入门到精通5:Pig数据模型

Pig从入门到精通5:Pig数据模型

作者: 金字塔下的小蜗牛 | 来源:发表于2020-04-04 23:42 被阅读0次

1.关系型数据库中的表结构

传统的关系型数据库中,表结构如下图所示:

image

为了保持数据的一致性,每一行记录都具有相同的列,而且每一列都要有值,哪怕是NULL值,也要填充完整。

2.Pig中的”表”Bag结构

Pig中的”表”不像关系型数据库中的表那样是方方正正的表格形式,而是一种叫做Bag的包结构,如下图所示:

image

关于bag有以下几点说明:

  1. Pig中的“表”叫做bag,bag中的”行”叫做tuple,tuple中的”列”叫做field。
  2. Pig的表bag不要求每一行tuple都具有相同的列field。
  3. Pig的表bag中的”行”tuple可以嵌套”表”bag。

3.Pig中的”关系”结构

虽然说Pig中的包bag不要求每一行tuple都拥有相同的field,但是很多时候我们需要使用相同列的表结构,如下图所示:

image

这时候,我们就可以人为的将每一行设置成相同的列,如此就形成一个”关系”。

可以看到,”关系”结构更像RDBMS中的表结构。

相关文章

网友评论

      本文标题:Pig从入门到精通5:Pig数据模型

      本文链接:https://www.haomeiwen.com/subject/nrpkdhtx.html