美文网首页
白话数据库范式

白话数据库范式

作者: nlpjoe | 来源:发表于2016-06-14 01:41 被阅读270次

    前言

    静下心来写一篇介绍1NF、2NF、3NF与BCNF范式的文章。

    整体关系


    他们的约束如上图,也就是说:

    • 满足1NF的约束一定满足2NF。
    • 满足2NF的约束一定满足3NF。
    • 满足3NF的约束一定满足BCNF范式。

    从1NF说起

    1NF是最宽松的范式,只要属性不可分割就满足1NF。什么是属性?属性就是表中的字段。也就是说,只要存在于数据库里表都满足1NF。那么什么样的表不满足1NF?比如这样一个关于客户信用卡交易的表:


    因为我们不知道具体的用户、具体的信用卡信息、具体的交易信息,所以无法存入数据,为了满足1NF我们需要对其细化,如下:


    我们细化了表属性,同时存入了一些数据。那么你发现有什么问题了吗?

    细思极恐,你会发现这样一些问题:

    1. 数据冗余:
      想一下,比如我们的用户Alan,如果有上百条他的交易信息,那么他的用户ID、用户姓名、办卡日期信息会造成大量冗余。

    2.插入操作异常:
    如果我们有一名新会员Joe办了卡,但是没有交易信息,那么在这个表里,我们应该怎么插入这条信息?答案是不能插。

    3.更新操作复杂:
    如果我们的用户姓名更改了,比如Alan名字改成了Joe,那么我们每条信息都必须要更改,是否有点愚蠢?

    4.删除操作异常:
    如果Alan这个用户卡注销了,我们必须把所有关于Alan的信息删除点,这很愚蠢。并且如果我们想把他的交易信息保留下来,是不能做到的。

    所以,人们为了解决这些问题,对表有了更加严谨的约束。

    2NF

    2NF做了什么?他的改进是:

    在1NF的基础上,消除了非主属性对于码的部分函数依赖。

    这里有几个概念需要复习一下:

    • 函数依赖
    • 非主属性。

    复习分根线

    函数依赖

    这是在范式中很重要的概念,也很好理解。简单,

    知道A就能推出B,就称B对于A函数依赖,记做A→B。

    比如本例中:


    (用户ID)→(用户姓名)
    即知道了用户ID 就知道了用户姓名,所以,用户姓名 对于 用户ID 函数依赖。

    那么函数依赖有哪些类型呢?它有三种类型:

    • 完全函数依赖
    • 部分函数依赖
    • 传递函数依赖。

    完全函数依赖

    在一张表中,若X→Y,且对于X的任何一个真子集X',X'→Y都不成立,那么称Y对于X完全依赖。

    比如(用户ID) → (用户姓名),用户姓名对于用户ID就是完全函数依赖。

    部分函数依赖

    假如X→Y,但是Y不完全依赖于X,那么就称Y部分依赖于X。

    比如本例的(用户ID,交易ID)→(交易日期,金额)就是部分函数依赖。因为(交易ID)→(交易日期,金额),所以(交易日期,金额)部分依赖于(用户ID)。

    传递函数依赖

    假如Z依赖于Y,Y依赖于X,那么就称Z传递依赖于X。

    设 K 为某表中的一个属性或属性组,若除 K 之外的所有属性都完全函数依赖于 K(注意是完全),那么我们称 K 为候选码,简称为码。

    比如本例中(用户ID,信用卡ID,交易ID)能推出所有属性,那么(用户ID,信用卡ID,交易ID)就是码。码就不细说了,不然篇幅较长。

    非主属性

    不是码的属性。

    比如本例中 用户ID信用卡ID交易ID是主属性,用户姓名、办卡日期、交易日期、金额是非主属性。


    回到主线

    终于可以接着讲2NF了,再读这句话,我们有了不一样的理解:

    在1NF的基础上,消除了非主属性对于码的部分函数依赖。

    我们列出所有的函数依赖:

    1. (用户ID,信用卡ID,交易ID)→(用户姓名,交易日期,金额)
    2. (用户ID)→(用户姓名)
    3. (交易ID)→(交易日期,金额)

    发现存在(用户ID)→(用户姓名),(交易ID)→(交易日期,金额)的部分依赖,所以我们对表进行分解,如下:


    分解后R1、R2、R3均不存在部分函数依赖,符合2NF。

    3NF

    例子举得不好,后面来补坑。。。

    相关文章

      网友评论

          本文标题:白话数据库范式

          本文链接:https://www.haomeiwen.com/subject/fxxudttx.html