数据仓库概述
一、数据仓库的特征
数据仓库就是一个面向主题的、集成的、稳定的、随时间变化二变化的数据集合。
1、面向主题
主题是指用户使用数据仓库进行决策时所关心的重点领域,也就是在一个较高的管理层次上对信息系统的数据按照某一具体的管理对象进行综合、归纳所形成的分析对象。
2、继承性
数据仓库中存储的数据一般从企业原来已经建立的数据库系统中提取出来,但并不是原有数据的简单拷贝,而是经过了抽取、筛选、清洗、转换、综合等工作得到的数据。
3、稳定性
数据仓库在某个时间段内来看是保持不变的。
4、随时间变化性
数据仓库大多关注的是历史数据,其中的数据是批量载入的 ,即定期从操作型应用系统中接收到新的数据内,这使得数据仓库中的数据总是拥有时间维度。
二、数据仓库的应用
1、决策支持
数据仓库系统提供各种业务数据,用户利用各种访问工具从数据仓库获取决策信息,了解业务的运营情况。
2、客户分类评价
以客户为中心的业务策略,最重要的特征是细分市场,即把客户或潜在客户分为不同的类别,针对不同种类的客户提供不同的产品和服务,采用不同的市场和销售策略。
3、市场自动化
决策支持帮助企业指定产品和市场策略,客户分类和评价为企业指出了目标客户的范围,下一步是对这些客户展开市场攻势。
三、数据仓库系统的组成
1、抽取工具
用于把数据从各种各样的存储环境中提取出来,进行必要的转换、整理,再存放到数据仓库内。
2、数据集市
数据集市是在构建数据仓库的时候经常用到的一个词语。
3、元数据及其管理
元数据时关于数据的数据,在数据仓库中元数据位于数据仓库的上层,时描述数据仓库内数据的结构、位置和建立方法的数据。