【转】数据库反规范化

注：文章来自百度文库，具体作者不详

反规范化目标：确定是否放松规范化规则程度引入受控冗余数据来改善系统性能。

为什么要加入反规范化呢，原因在于规范化的目标是减少冗余和提高表设计的灵活性，但是与此同时也增加了在查询数据连接查询的难度。如果系统对查询的频率和性能要求很高，那么我们就不能不在设计和冗余上权衡，已得到一个折中的解决方法。而而折中的方式就是引入受控冗余来降低规范化程度。

当然反规范化确实带来了不少缺点：

1.反规范化是实现更加复杂

2.反规范化经常会牺牲设计的灵活性

3.反规范化可能加快检索速度，但是会减低更新和插入数据的速度

对于反规范化，有以下类型可遵循的：

1.合并一对一的关系

这个很容易理解，对于两个已有的一对一关系的表，将其合并，并选择其中的一个表的主键作为新表的主键。

2.复杂一对多关系的非键列来减少连接查询

为了减少或删除经常性的查询链接，我们可以考虑对于一个 1:n 关系的两个表添加冗余项，其实际操作是在 1 关系中的主表中选取出经常被n 关系的表连接访问的属性，直接冗余添加的n 关系表中。例子：

这是一个学生 – 部门表关系，假设如果系统每天要通过 student 表中的deptid 外键来查询department 的 deptname ，而且其频率是 10000 / day 。很明显，通过student 表中的deptid 外键来查询department 的 deptname 必须通过连接查询才能得到相关结果，而连接查询往往起查询速度慢直接表查询一个数量级，在高频率访问的条件下，引入冗余，改造表来减低规范化程度如下：

在student 表中添加冗余项 deptname。这样可以大大的减少在此关系上的链接查询，进入提高的系统的性能。

3.复制多对多关系中的列来减少连接查询

对于 n：m 关系的表，举个例子，其表结构应该是：

Student ：Teacher : 每一个学生都可以由多个老师教，每个老师也可以教多个学生。对于这样的一个表结构，其连接查询就在于用关系表的外键来查询 student 和 teacher 表中相关的数据。，和明显，这里包含了两个连接步骤，如果查询频率过高，那么连接查询总体消耗的效率那就不言而喻了。对于这样的表，引入冗余点在于在 stu_tea 表中田间 student 或 teacher 表中的一些关键列，这些列式经常通过连接查询得到的。

假设经常被连接查询的关键列式 student.name 和 teacher.teachername 。那可以考虑将这两列加入到 stu_tea 中。这样可以极大的减少连接查询的次数。