我们该如何设计数据库(三)(续)

上篇博客《我们该如何设计数据库(三)》写出来之后，深感自己写得不够清晰，虎头蛇尾，描述问题用了很多篇幅，而问题的解决方案及其优缺点却是一笔带过，于是就写下了这篇博客来负荆请罪

示例代码下载：点击这里下载

示例代码说明见下文

首先让我们来回顾一下《我们该如何设计数据库(三)》中描述的问题：

现在有一个系统，我们暂时假设为学校选课系统。

系统要按学校来卖。每个学校的选课逻辑都是一样的，而表中的数据有共性，但是也有差异性。比如说基本的Teacher表结构是这样的：

现在把系统卖给A学校。A学校除了的Teacher表除了用户名和密码之外，还要储存老师的FirstName和LastName，那么表结构变化如下：

现在B学校也买了我们的系统。他们的Teacher表不要FirstName和LastName，但是要储存教师的工号“Number”，表结构如下：

好，现在我们的问题出来了：怎么去解决这种差异性

大致有3种解决方法

1、表中加冗余

2、增加冗余表

3、model继承

第一种思路：表中加冗余，在上篇已经分析过了，在此就稍微说一下优缺点。

优点在于简单：思路简单，实现也简单

缺点在于维护困难：①如果我们的系统卖了很多所学校，那么对于系统维护人员来说，这是一场噩梦 ②违背开闭：每次加字段都要去修改已有Model

第二种思路：增加冗余表

如上一篇文章中徐少侠所言，我们也可以这样来设计，用一张冗余表来储存差异字段，如图所示：

FirstName、LastName、Number对应扩展表内的三行

这样的好处在于：思路简单，实现相比第一种思路复杂一些，但是也不算复杂

缺点在于：①Join

　　　　　②违背开闭：每次加字段都要去修改已有Model

（徐少侠在留言中也说了缺点：查询数据时候比较辛苦.只能用在读写压力不高的地方.）

第三种思路：Model继承

这种方法，比较适合使用ORM，或者说适合有Code First的ORM

在这里使用的是EF5（EF5推荐环境是.NET 4.5，不过.NET 4也无伤大雅）

    public class Identifier
    {
        [Key]
        public int ID { get; set; }
    }

    public interface Contact
    {
        string Phone { get; set; }
        string Email { get; set; }
    }

   public class TeacherBase : Identifier, Contact
    {
        [StringLength(50)]
        public string UserName { get; set; }

        [StringLength(50)]
        public string Pwd { get; set; }

        [StringLength(50)]
        public string Phone { get; set; }

        [StringLength(50)]
        public string Email { get; set; }
    }

这样就是我们的Teacher基础表。

那么我们的系统卖给我A学校，A学校Teacher表有两个自己的差异字段：FirstName,LastName。那么Model就要这样写

namespace Model.A
{
    public class Teacher : TeacherBase
    {
        [StringLength(50)]
        public string FirstName { get; set; }

        [StringLength(50)]
        public string LastName { get; set; }
    }
}

生成出来的数据库如图：

然后又把系统卖给了B学校。B学校系统的部署是独立的。B学校Teacher表差异字段为Number：

namespace Model.B
{
    public class Teacher : TeacherBase
    {
        [StringLength(50)]
        public string Number { get; set; }
    }
}

生成出来的数据库如图：

这样做的优势在于：

1、使用了OO的思想来设计Model，更易于理解与后期维护。

　　对于查看类的继承关系，VS也提供了很好的支持，比如说你可以这样看：

　　你也可以这样看：

2、更清晰的关注点分离.

　　其实这个是Code First的好处，让程序员可以直接从Model写起，不必关注数据库中的表结构

　　如果您对于使用ORM自生成数据库有疑问，请自行百度"Code First"和"数据迁徙"。也欢迎留言讨论

这样做的缺点在于：

1、依赖ORM

2、违背开闭原则：要修改Namespace来切换Model（详情见下文）想要切换Model，要修改一处地方（见下文），虽然修改很少，但还是让人不爽

3、违背了第三范式：

　　如Contact，根据第三范式应该独立作为一个表，但是这里却是写入了Teacher表中

　　也的确有无数人——朋友，同事，网友——吐槽过我对于第三范式的违反，但是我还是坚持：严格的一对一关系，就是应该写到各个表中，而不是独立作为一个表

　　违反第三范式的好处在于：更少的Join

　　而坏处在于：如果要修改，则要修改很多地方。例如Teacher和Student都有Contact，那么如果Contact要加一列Fax，那么要修改两处地方，这可能带来额外的错误。但是这个缺点因为使用了Model继承，将不再那么明显：修改Contact接口，然后修改实现了Contact接口的Teacher与Student的Model；因为有智能提示的存在，这样不会出错

为了方便理解，我上传了源代码：点击这里下载

请用VS2010打开，VS2008我不确定能不能运行。请确保有本地数据库的权限

打开之后直接运行，会在本地数据库生成DBaccess.B.Context名字的数据库

在程序中我没有写数据迁徙，所以如果您修改了Model，要把之前生成的数据库删掉之后再运行；直接运行会报错

如果想切换Model，将“Test”中的using Model.B改为using Model.A即可

这也意味着切换数据库要修改命名空间。对于这个问题我还没有好的解决办法。本来是想用反射工厂来解决这个问题（代码中未实现的ModelFactory），但是反射出来的是Object，要As了之后才能用

如果有哪位大牛有解决办法，求告知，小弟在此跪谢

现在实现了ModelFactory，使用了预编译指令来选择NameSpace：

#define A
#if B
using Model.B;
using DBaccess.B;
#endif
#if A
using Model.A;
using DBaccess.A;
#endif

若要切换Model，将#define B 改为 #define A 即可

就此搁笔

PS：12306是一群小学生作的么？

再PS：有园友批评我“手中有个锤子，看到什么都是钉子”，说的是我什么问题都想用ORM来解决。关于锤子问题我不否认，但是那个锤子是NOSQL，只是现在还没写到而已

posted @ 2012-10-10 11:00 CrazyJinn 阅读(4118) 评论(18) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

CrazyJinn

我们该如何设计数据库(三)(续)

公告