数据库系统概念 第一章 引言
数据库管理系统由一个互相关联的数据的集合和一组用以访问这些数据的程序组成。 这个数据集合通常称为数据库。
数据视图
数据库系统的一个主要目的是给用户提供数据的抽象视图,系统隐藏关于数据存储和维护的某些细节
数据抽象:
一个可用的系统必须能高效地检索数据,这种高效性的需求促使设计者在数据库中使用复杂的数据结构来表示数据。
系统开发人员通过如下几个层次上的抽象来对用户屏蔽复杂性:
1 物理层:最低层次的抽象,描述数据实际上是怎么存储的,物理层详细描述复杂的底层数据结构
2 逻辑层:描述数据库中存储什么数据及这些数据间存在什么关系
3 视图层:只描述整个数据库的某个部分
实例和模式:
特定时刻存储在数据库中的信息的集合称作数据库的一个实例
数据库的总体设计称作数据库模式,数据库可以分为几种不同的模式:
1 物理模式:在物理层描述数据库的设计
2 逻辑模式:在逻辑层描述数据库的设计
3 子模式:描述了数据库的不同视图
数据模型:
数据库结构的基础是数据模型。数据模型是一个描述数据、数据联系、数据语义以及一致性约束的概念工具的集合
数据模型提供了一种描述物理层、逻辑层以及视图层数据库设计的方式:
数据模型可被划分为四类:
1 关系模型:用表的集合来表示数据和数据间的联系。
2 实体-联系模型:实体-联系(E-R)数据模型基于对现实世界的这种认识:
现实世界由一组称作实体的基本对象以及这些对象间的联系构成
3 基于对象的数据模型:面向对象的数据模型可以看成是E-R模型增加了封装、方法和对象标识等概念后的扩展
4 半结构化数据模型:允许那些相同类型的数据项含有不同的属性集的数据定义,XML被广泛地用来表示半结构化数据
数据库语言:
数据操纵语言(DML):它使用户可以访问或操纵那些按照某种适当的数据模型组织起来的数据。
数据定义语言(DDL):数据库所使用的存储结构和访问方式是通过一系列特殊的DDL语句来说明的
存储在数据库中的数据值必须满足某些一致性约束:
域约束:每个属性都必须对应于一个所有可能的取值构成的域
参照完整性:一个关系中给定属性集上的取值也在另一关系的某一属性集的取值中出现
断言:一个断言就是数据库需要时刻满足的某一条件
授权:对于不同的用户在数据库中的不同数据值上允许不同的访问类型:读权限、插入权限、更新权限、删除权限
关系数据库:
表:
数据操纵语言:
数据定义语言:
数据库设计:
设计过程:
制定出用户需求的规格文档→数据库的概念模式
数据存储和查询:
数据库系统的功能部件大致可分为存储管理器和查询处理部件:
存储管理器:
是数据库系统中负责在数据库中存储的低层数据与应用程序以及向系统提交的查询之间提供接口的部件。
存储管理器负责与文件管理器进行交互
原始数据通过操作系统提供的文件系统存储在磁盘上,存储管理器将各种DML语句翻译为底层文件系统命令
因此,存储管理器负责数据库中数据的存储、检索和更新。
存储管理部件包括:
1 权限及完整性管理器
2 事务管理器
3 文件管理器
4 缓冲区管理器
存储管理器实现了几种数据结构,作为系统物理实现的一部分:
1 数据文件:存储数据库自身
2 数据字典:存储关于数据库结构的元数据,尤其是数据库模式
3 索引:提供了对数据项的快速访问,数据库索引提供了指向包含特定值的数据的指针
查询处理器:
1 DDL解释器:解释DDL语句并将这些定义记录在数据字典中
2 DML编译器:将DML语句翻译为一个执行方案,包括一系列查询执行引擎能理解的低级指令,还进行查询优化
3 查询执行引擎:执行由DML编译器产生的低级指令
事务管理:
原子性:要么完成要么不发生
一致性:必须保证数据库正确
持久性:
数据库体系结构:
数据挖掘与信息检索
数据挖掘:指半自动地分析大型数据库并从中找出有用的模式的过程
信息检索:查询非结构化的文本数据
数据库用户和管理员:

浙公网安备 33010602011771号