美文网首页
Data Normalization 数据规范化

Data Normalization 数据规范化

作者: 珏_Gray | 来源:发表于2019-11-13 11:58 被阅读0次

我们可以借用数据库中的有关技术来梳理数据间的关系。

Overview


数据规范化是指使用多张相关联的表格来组织数据以减少数据冗余的一种技术。

数据冗余,顾名思义,指数据的重复出现。它会带来以下问题:

  • 占用更多的数据存储空间
  • 数据插入问题:每插入新的记录,都要重复存储一次已有的数据
  • 数据删除问题:删除数据时,会把相关联的其他数据也一并删除
  • 数据更新问题:需同步更新所有重复的数据,否则会出现数据不一致
Before 4th Normal Form

Normalization


1st Normal Form

最基础的数据库表格要求,即,所有的数据必须至少是1st Normal Form。

规则:

  1. Each Column should contain atomic values. 每列只能包含单一值。
  2. A Column should contain values that are of the same type. 列中只能包含相同类型的值。
  3. Each Column should have a unique name. 每列的名称必须唯一。
  4. Order in which data is saved doesn't matter. 数据的存储顺序是任意的。
  5. Rows uniquely identified. 每行数据均不同。

2nd Normal Form

规则:

  1. It should be in 1st Normal Form. 必须已经处于1st Normal Form。
  2. All attributes(Non-Key Columns) dependent on the key. 所有非键列依赖于键。
  3. It should not have any Partial Dependencies. 不应有任何部分依赖。

Dependency(Functional Dependency):
非主键值可以通过主键来唯一确定。
Partial Dependency:
非主键值只依赖于主键的一部分。

3rd Normal Form

规则:

  1. It should be in 2nd Normal Form. 必须处于2nd Normal Form。
  2. It should not have Transitive Dependency. 不应有依赖传递。

Transitive Dependency:
非主键值依赖于主键之外(非主键)的列。

Boyce-Codd Normal Form(3.5 Normal Form or BCNF)

规则:

  1. It should be in 3rd Normal Form. 必须处于3rd Normal Form。
  2. For any dependency A->B, A should be a super key. 对于任何依赖关系A->B,A应该是super key。即不存在主键B依赖于非主键A的情况。

4th Normal Form

规则:

  1. It should be in BCNF. 必须处于BCNF。
  2. No multi-valued Dependecy.

参考视频:
Database Normalization Series by Studytonight
Normalization - 1NF,2NF,3NF & 4NF by channel5567

相关文章

  • Data Normalization 数据规范化

    我们可以借用数据库中的有关技术来梳理数据间的关系。 Overview 数据规范化是指使用多张相关联的表格来组织数据...

  • Feature Scaling: Normalization &

    Normalization / 规范化 / 最大最小缩放 Standardization / 标准化 区别

  • Day1 Training Neural Networks, p

    关键词:Data Preprocessing、zero-centered、normalization、PCA、白化...

  • 均一化和标准化

    数据的标准化(normalization)和归一化 数据的标准化(normalization) 将数据按比例缩放,...

  • Feature scaling

    划重点: Feature scaling思维导图什么是Data normalization和Feature sca...

  • Normalization

    第一种Normalization 将数据标准化(normalization)是将具有不同量纲(单位)、大小的数据映...

  • 论文分享|“可切换规范化”

    论文分享 作者:-1-基 编辑整理:萝卜兔 规范化模块(Normalization)现在已经成为了深度学习不可缺少...

  • Batch Normalization

    Batch Normalization,顾名思义,批规范化,是深度学习中常用的一种训练优化方法。 BN 的目的 ...

  • Normalization

    深度学习中的Normalization: (i. 更好train;ii. 防过拟合)1 对神经元输出规范化:Ba...

  • 使用 LocalBroadcastManager 实现事件总线

    总线(Bus)是指计算机组件间规范化的交换数据(data)的方式,即以一种通用的方式为各组件提供数据传送和控制逻辑...

网友评论

      本文标题:Data Normalization 数据规范化

      本文链接:https://www.haomeiwen.com/subject/bvdhictx.html