Hadoop构建数据仓库实践读书笔记【2】--主要数据仓库架构

几种主要的架构方法:数据集市架构、Inmon企业信息工厂架构、Kimball数据仓库架构和混合型数据仓库架构。

数据集市是按主题域组织的数据集合,用于支持部门级的决策。两种类型的数据集合:独立数据集市和从属数据集市。

  • 独立数据集市集中于部门所关心的单一主题域,数据以部门为基础部署,无须考虑企业级别的信息共享与集成。数据分析或商业智能工具直接从数据集市查询数据,并将查询结果显示给用户。周期短,见效快。
  • 从属数据集市,数据来源于数据仓库,经过整合、重构、汇总后传递给所从属数据集市。

建立从属数据集市的好处主要有:

  1. 性能:当数据仓库的查询性能出现问题,可以考虑建立几个从属数据集市,将查询从数据仓库移出到数据集市。
  2. 安全:每个部门可以完全控制他们自己的数据。
  3. 数据一致:因为每个数据集市的数据来源都是同一个数据仓库,有效消除了数据不一致的情况。

Kimball 和Inmon 两种架构的主要区别在于核心数据仓库的设计和建立。Kimball的数据仓库包含高粒度的企业数据,使用多维模型设计,这样意味着数据仓库由星形模式的维度表和事实表构成。

混合型结构:在一个数据仓库环境中,联合使用INmon 和Kimball 两种架构。

操作数据存储又称为ODS,是Operational Data Store 的简写,是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。

 

posted on 2019-07-11 10:42  菲菲菲非常可爱的小白兔  阅读(208)  评论(0编辑  收藏  举报