数据库范式

 第一范式(1NF)无重复的列,强调的是列的原子性

       第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1NF)中表的每一行只包含一个实例的信息。简而言之,第一范式就是无重复的列

第二范式(2NF)属性完全依赖于主键 [ 消除部分子函数依赖 ]

  如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键, 则称为第二范式模式。

      一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。 

  第二范式(2NF)是在第一范式(1NF)的基础上建立起来的,即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式(2NF)要求数据库表中的每个实例或行必须可以被惟一地区分。为实现区分通常需要为表加上一个列,以存储各个实例的惟一标识。这个惟一属性列被称为主关键字或主键、主码

     假定选课关系表为SelectCourse(学号, 姓名, 年龄, 课程名称, 成绩, 学分),关键字为组合关键字(学号, 课程名称),因为存在如下决定关系:

     (学号, 课程名称) → (姓名, 年龄, 成绩, 学分)

     这个数据库表不满足第二范式,因为存在如下决定关系:

     (课程名称) → (学分)

     (学号) → (姓名, 年龄)

     即存在组合关键字中的字段决定非关键字的情况。

 把选课关系表SelectCourse改为如下三个表:

  学生:  Student(学号, 姓名, 年龄);

  课程:  Course(课程名称, 学分);

  选课关系:SelectCourse(学号, 课程名称, 成绩)。

    这样的数据库表是符合第二范式的, 消除了数据冗余、更新异常、插入异常和删除异常。另外,单关键字的数据库表都符合第二范式,因为不可能存在组合关键字。

第三范式(3NF)属性不依赖于其它非主属性 [ 消除传递依赖 ]

   如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R为第三范式模式。

     满足第三范式(3NF)必须先满足第二范式(2NF)。第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息

     例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在的员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入 员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。

  第三范式(3NF):在第二范式的基础上,数据表中如果不存在非关键字段对任一候选关键字段的传递函数依赖则符合第三范式。简而言之,第三范式就是属性不依赖于其它非主属性。 

    所谓传递函数依赖,指的是如果存在"A → B → C"的决定关系,则C传递函数依赖于A。

    因此,满足第三范式的数据库表应该不存在如下依赖关系:

    关键字段 → 非关键字段x → 非关键字段y

   假定学生关系表为Student(学号, 姓名, 年龄, 所在学院, 学院地点, 学院电话),关键字为单一关键字"学号",因为存在如下决定关系:

      (学号) → (姓名, 年龄, 所在学院, 学院地点, 学院电话)

     这个数据库是符合2NF的,但是不符合3NF,因为存在如下决定关系:

     (学号) → (所在学院) → (学院地点, 学院电话)

     即存在非关键字段"学院地点"、"学院电话"对关键字段"学号"的传递函数依赖。

     也会存在数据冗余、更新异常、插入异常和删除异常的情况

    把学生关系表分为如下两个表:

        学生:(学号, 姓名, 年龄, 所在学院);

        学院:(学院, 地点, 电话)。

   这样的数据库表是符合第三范式的,消除了数据冗余、更新异常、插入异常和删除异常。

鲍依斯-科得范式(BCNF是3NF的改进形式)

      若关系模式R是第一范式,且每个属性都不传递依赖于R的候选键。这种关系模式就是BCNF模式。即在第三范式的基础上,数据库表中如果不存在任何字段对任一候选关键字段的传递函数依赖则符合鲍依斯-科得范式。

      假设仓库管理关系表为StorehouseManage(仓库ID, 存储物品ID, 管理员ID, 数量),且有一个管理员只在一个仓库工作;一个仓库可以存储多种物品。这个数据库表中存在如下决定关系:

      (仓库ID, 存储物品ID) →(管理员ID, 数量)

      (管理员ID, 存储物品ID) → (仓库ID, 数量)

      所以,(仓库ID, 存储物品ID)和(管理员ID, 存储物品ID)都是StorehouseManage的候选关键字,表中的唯一非关键字段为数量,它是符合第三范式的。但是,由于存在如下决定关系:

     (仓库ID) → (管理员ID)

     (管理员ID) → (仓库ID)

     即存在关键字段决定关键字段的情况,所以其不符合BCNF范式。它会出现如下异常情况:

    (1) 删除异常:

         当仓库被清空后,所有"存储物品ID"和"数量"信息被删除的同时,"仓库ID"和"管理员ID"信息也被删除了。

    (2) 插入异常:

        当仓库没有存储任何物品时,无法给仓库分配管理员。

   (3) 更新异常:

        如果仓库换了管理员,则表中所有行的管理员ID都要修改。

    把仓库管理关系表分解为二个关系表:

    仓库管理:StorehouseManage(仓库ID, 管理员ID);

    仓库:Storehouse(仓库ID, 存储物品ID, 数量)。

    这样的数据库表是符合BCNF范式的,消除了删除异常、插入异常和更新异常。

     

    

注意点:

  1. 数据库连接会带来一部分的性能损失
  2. 并不是数据库范式越高越高
  3. 有时会在数据冗余与范式之间做出权衡,在实际的数据库开发过程中,往往会允许一部分的数据冗余来减少数据库连接。

参考:

https://blog.csdn.net/ljp812184246/article/details/50706596

https://blog.csdn.net/Dream_angel_Z/article/details/45175621

 

posted on 2018-10-24 10:17  溪水静幽  阅读(120)  评论(0)    收藏  举报