第7章 数据库设计和E-R模型
总结
数据库设计主要涉及数据库模式的设计。实体-联系(Entity-Relationship,E-R)数据模型是一个广泛用于数据库设计的数据模型。它提供了一个方便的图形化表示方法以查看数据、联系和约束。
E-R模型主要用于数据库设计过程。它的发展是为了帮助数据库设计,这是通过允许定义企业模式(enterprise schema)实现的。这种企业模式代表数据库的全局逻辑结构,该全局结构可以用E-R图(E-R Diagram)图形化表示。
实体(Entity)是现实世界存在并且区别于其它对象的对象。我们通过把每个实体同描述该实体的一组属性相关联来表示区别。
联系(relationship)是多个实体之间的关联。相同类型的联系的集合为联系集(relationship set),相同类型的实体的集合为实体集(entity set)。
术语超码(superkey)、候选码(candidate key)以及主码(primary key)同适用于关系模式一样适用于实体和联系集。在确定一个联系集的主码时需要小心,因为它来自一个或多个相关的实体集的属性组成。
(超码是一个或多个属性的集合,这个集合可以使我们在一个关系中唯一地标识一个元组。最小的超码称为候选码。主码代表被数据库设计者选中,主要用来在一个关系中区分不同元组的候选码。码(不论是主码、候选码或超码)是整个关系的一种性质,而不是单个元组的的性质。)
映射的基数(mapping cardinality)表示通过联系集可以和另一个实体相关联的实体的个数。
不具有足够属性构成主码的实体集称为弱实体集(weak entity set)。具有主码的实体集称为强实体集(strong entity set)。
E-R模型的各种性质为数据库设计者提供了大量的选择,使设计人员可以最好地表示被建模的企业。在某些情况中,概念和对象可以用实体、联系或属性来表示。企业总体结构的各方面可以用弱实体集、概化、特化或聚集很好地描述。设计者通常需要在简单的、紧凑的模型与更精确但也更复杂的模型之间进行权衡。
用E-R图定义的数据库设计可以用关系模式的集合来表示。数据库的每个实体集和联系都有唯一的关系模式与之对应,其名称即为相应的实体集或联系集的名称。这是从E-R图转换为关系数据库设计的基础。
特化(specialization)和概化(generalization)定义一个高层实体集和一个或多个低层实体集之间的包含关系。特化是取出高层实体集的一个子集来形成一个低层实体集。概化是用两个或多个不相交的(低层)实体集的并集形成一个高层实体集。高层实体集的属性被低层实体集继承。
聚集(aggregation)是一种抽象,其中联系集(和跟它们相关的实体集一起)被看作高层实体集,并且可以参与联系。
UML是一种常用的建模语言。UML类图广泛应用于对类建模以及一般的数据建模。
术语
实体-联系数据模型
实体和实体集(属性、域、简单和复合属性、单值和多值属性、空值、派生属性)
超码、候选码以及主码
联系和联系集(二元联系集、联系集的度(参与联系集的实体集的数目)、描述性属性、(超码、候选码以及主码)、角色、自环联系集)
E-R图
映射基数(一对一联系、一对多联系、多对一联系、多对多联系)
参与(全部参与、部分参与)
弱实体集和强实体集(分辨符属性、标识联系)
特化和概化(超类和子类、属性继承、单和多继承、条件定义的和用户定义的的成员资格、不相交概化和重叠概化、全部概化和部分概化)
聚集
UML
UML类图
浙公网安备 33010602011771号