01.数据仓库定义

1.1 数据仓库定义

是一个面向主题的集成的相对稳定的、反映有有历史变化的数据集合,用于支持管理决策。具有以下特点:

  • 详细交易及相关业务数据的集合
    解释为

    仓库的数据来自于业务系统的数据库,
    业务库的数据是什么样子,数据同步迁移过来的原始数据就一样是怎么样子。
    这体现了据的一致性
  • 包含必要的内部与外部信息
    解释

    从丰富仓库的数据价值考虑,只要能够体现,通过爬虫可以获取外部的数据,
    与内部数据进行整合,提升数据可用性,丰富数据价值。
    
  • 来自于多个数据源、业务操作系统
    解释

    公司的业务系统,基本上都是 微服务化,同样每个微服务化的系统,不存在或者存在1+多个数据源。
    
  • 保存一定的时间周期
    解释

    数据是有效性的,数据价值曲线,数据太久远的,例如,20年前的数据,价值很低
    社会变动太快,产生数据快,最新,最近的数据 无疑价值最大的。
    
  • 按照企业内业务规则决定存储模型

    解释

    仓库的数据,不是数据的堆砌,是需要符合公司的业务规则的
    在业务需求下,进行数据存储建模的
    

1.2 数仓价值

  • 提高管理决策的科学性和管理效率

    数仓以数据为事实依据,对管理层的决策提供支持,事中问题的返现&处理,事后的反馈。
    有效提升管理的科学性和管理效率。
    
  • 信息的整合,可推动现在有信息管理体系的重构

    将纳入到数仓中的数据,进行多层多角度的信息整合,完善、丰富数据含量。
    
  • 打通信息孤岛全局共享,降低数据获取的难度

    数仓拥有公司内外众多数据(业务、外部)进行数据关联,解除数据信息孤立点,丰富信息含量
    处理方式:之前在业务系统无法做到(需要跨越众多数据源),现在在仓库直接进行处理
    
  • 逐渐取代各类业务管理报表系统

    数仓最基本的功用,提供业务报表,原因报表实时比较差,维度众多,对于业务系统提供,是一个十分耗时和资源的事情,但是对仓库是非常的简单。
    
  • 运用历史数据发现规律

    对于拥有业务的历史数据,根据需求/小主题进行,统计分析,从数据上发现业务发展的规律性,提前进行预警和分析。
    

1.3 数仓建设必要性

数据仓库的价值上面已经提到,那么建设必要性不言而喻。
目前大多数信息系统由于建设时间、建设方、各阶段需求不同,会出现一系列问题:缺乏整体规则、信息缺乏完整性、缺乏统一的信息管理标准和规范、信息孤岛、不具备大容量的数据管理和分析能力。
数仓建设是一个持续的,不停完善和丰富的过程,

1.4 小结

  • 数仓目的,支持管理的决策
  • 数仓是数据集中,可管理,丰富价值和面向主题的数据结构体
  • 数仓建设是持续,阶段性的,不停完善的工程
posted @ 2021-02-20 11:44  可可逗豆  阅读(25)  评论(0)    收藏  举报