随笔分类 -  数仓

摘要:https://www.cnblogs.com/pengpenghuhu/p/14546305.html 阅读全文
posted @ 2021-04-14 09:32 cknds 阅读(995) 评论(0) 推荐(0)
摘要:事实表分成三种:事务事实表、周期快照事实表、累计快照事实表 事务事实表 官方定义是:发生在某个时间点上的一个事件。比如以订单为例:下单是一个事实、付款是一个事实、退款是一个事实,所有事实的累计就是事务事实表 周期快照事实表 如果需要对某一天或者某个月的数据进行分析,那么可以使用周期快照事实表,比如: 阅读全文
posted @ 2020-06-03 16:09 cknds 阅读(659) 评论(0) 推荐(0)
摘要:全量表全量表没有分区,表中的数据是前一天的所有数据,比如说今天是24号,那么全量表里面拥有的数据是23号的所有数据,每次往全量表里面写数据都会覆盖之前的数据,所以全量表不能记录历史的数据情况,只有截止到当前最新的、全量的数据。快照表那么要能查到历史数据情况又该怎么办呢?这个时候快照表就派上用途了,快 阅读全文
posted @ 2020-05-14 15:16 cknds 阅读(2836) 评论(0) 推荐(1)
摘要:原文地址:https://blog.csdn.net/xiepeifeng/article/details/42431027 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 1. 数据量比较大;2. 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;3. 需要查看 阅读全文
posted @ 2020-05-14 15:05 cknds 阅读(490) 评论(0) 推荐(0)
摘要:数据仓库设计方案 一.概述 数据仓库的特征在于面向主题、集成性、稳定性和时变性,用于支持管理决策。数据仓库的存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供统一的、规范的数据出口。数据仓库在构建过程中通常都需要进行分层处理。业务不同,分层的技术处理手段也不同。数仓分层的主要原因: 清晰数据 阅读全文
posted @ 2020-05-14 14:46 cknds 阅读(763) 评论(0) 推荐(0)