管理信息系统——004 数据库与数据仓库
数据库概念
数据:Data
数据库:Database,DB,长期存储在计算机内的有结构,可共享的相关数据的集合
数据库的特点
冗余度小,独立性高,控制能力强
数据库管理系统:DBMS,实现数据存储和数据访问,科学地组织和存储数据,高效地获取和维护数据
功能
数据定义DDL:定义数据库中的数据对象
数据操纵DML:实现对数据库的基本操作
数据库的建立和维护功能:数据装载、备份/恢复、性能分析等
数据库系统:DBS,由数据库、数据库系统、应用系统、数据库管理员、用户组成

数据库系统结构
三级模式的结构
外模式:也称为子模式或用户模式
模式:也称为逻辑模式
内模式:也称为物理模式或存储模式

二级映像
二级映像在DBMS内部实现这三个抽象层次的联系和转换。
外模式/模式映像:保证数据的逻辑独立性,数据库设计的变化不会影响用户的使用
模式/内模式映像:保证数据的物理独立性,底层DBMS的更换不会影响数据库的设计
实体联系模型

实体:用矩形
属性:用椭圆形
联系:用菱形

数据库设计的核心和难点在于ER图的设计,ER图设计的难点在于实体的识别,ER图设计的好坏对数据库应用软件1开发和使用具有很大影响。
数据模型
数据模型是对现实世界中的数据及其关系的抽象表示。
数据模型的层次
概念模型:按用户的观点对数据和信息建模,用于数据库设计,如E-R模型
逻辑模型:按计算机系统的观点对数据建模,用于DBMS实现。包括网状模型、层次模型、关系模型、面向对象模型等。
物理模型:对数据最底层的抽象,描述数据在磁盘系统内部的表示方式和存取方法。由DBMS实现和管理。
关系模型
关系【Relation】:表
元组【Tuple】:表中的一行,也叫记录
属性【Attribute】:表中的一列即为属性,也叫字段
域【Domain】:属性的取值范围
主键【Primary key】
外键【Foreign key】
数据仓库概述
数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,并用于支持企业的分析活动和决策任务。
数据仓库中数据表示
星形模型


雪花模型


数据仓库的体系结构
包含:数据源、数据存储与管理、OLAP服务器、前端工具

ETL
ETL = Extract Transform Load
数据仓库过程的核心技术是ETL
ETL过程通常要占用以数据为中心的项目的70%的时间
数据仓库的应用
信息处理
基于查询和基本的统计分析,可以发现有用的信息,但通常是反映直接存放在数据库中的信息,无法发现复杂的模式。
分析处理
支持基本的OLAP,包括切片与切块、下钻(drill down)、上卷(roll-up)和转轴。OLAP是数据汇总/聚集工具,帮助简化数据分析
数据挖掘
支持知识发现,自动发现隐藏在大量数据中的隐含模式和知识
OLTP和OLAP

数据立方体多维分析

浙公网安备 33010602011771号