数据底座
公司内部的大数据架构师提出的架构中,分为两层。 第一层叫数据湖,基本原则按照数据源格式存储所有数据。第二层叫Data Hub,存储加工处理后的数据。供应用层是应用。
数据湖内部又可以分为三个层:
第一层: 原始数据层,这个层是个临时数据存储层,只是临时存储从数据源采集的数据。转入下一层后,就被删除了。
第二层: 合格的数据层,这个层的数据有原始层加载进来,但是可以做一些简单的加工处理。这个层的数据将永久保存。
第三层:准确数据层,这个层数据主要用于数据科学分析。
Data Hub 层,主要存储业务实体,包含事实表,主数据表等。
华为有个概念叫数据底座,不知道和这个是不是同一个意思。有待确认。
华为把基础数据(参考数据)单独列出来,不同于主数据,不知道是否很有必要。
参考数据举例: 订单状体:新增,确认,付款,开票,送货 等。
比如,订单分类

浙公网安备 33010602011771号