数据仓库工具箱(第二章)

事实表技术基础

1.事实表结构:度量+外键+退化维度键+日期/时间戳
2.事实表中的数字度量分类:完全可加、半可加、不可加事实
3.事实表中的空值:度量可以有空值,外键不能有空值
4.一致性事实:一致性事实需要具有相同的命名
5.事实表分类:事务事实表、周期快照事实表和累计快照事实表
6.其他事实表:无事实的事实表、聚集事实表和合并事实表

 

维度表技术基础

重点:
1.每个维度表必须包含单一的主键列,可以作为与之关联的任何事实表的外键
2.主键不能是自然键,可以是无语义的整型主键(日期维度表可以不需要)
4.非规范化扁平维度:打破规范化设计,增加层次
5.维度表中的空值:使用Unknow替换空值
6.日历日期维度:主键用YYYYMMDD表示

非重点:
3.退化维度:除了主键没有其他内容
7.扮演角色的维度:比如在事实表中可能会有多个日期列,这些列名被称为角色
8.杂项维度:将混杂的、低粒度的标识和指示器合并到一起,建立杂项维度
9.雪花维度:避免使用,影响性能并且不易理解
10.支架维度:避免使用,维度表引用维度表,被引用的辅助维度称为支架维度

总之维度表必须有主键,使用Unknow替换空值,使用非规范化扁平维度。

posted @ 2019-11-25 20:24  时光快照  阅读(247)  评论(0编辑  收藏  举报