数据底座

公司内部的大数据架构师提出的架构中,分为两层。 第一层叫数据湖,基本原则按照数据源格式存储所有数据。第二层叫Data Hub,存储加工处理后的数据。供应用层是应用。

数据湖内部又可以分为三个层: 

第一层: 原始数据层,这个层是个临时数据存储层,只是临时存储从数据源采集的数据。转入下一层后,就被删除了。

第二层: 合格的数据层,这个层的数据有原始层加载进来,但是可以做一些简单的加工处理。这个层的数据将永久保存。

第三层:准确数据层,这个层数据主要用于数据科学分析。

Data Hub 层,主要存储业务实体,包含事实表,主数据表等。

华为有个概念叫数据底座,不知道和这个是不是同一个意思。有待确认。

华为把基础数据(参考数据)单独列出来,不同于主数据,不知道是否很有必要。

参考数据举例: 订单状体:新增,确认,付款,开票,送货 等。

比如,订单分类

posted @ 2021-12-12 21:11  ZH谢工  阅读(4032)  评论(0)    收藏  举报