04-数据仓库之数据同步策略
摘要:1、数据同步 因为我们需要每天分析的数据都是最新的!!!所以就涉及数据的同步 2、表的分类 ①实体表: 一般是指一个现实存在的业务对象,比如用户,商品,商家,销售员等 ②维度表: 一般是指对应一些业务状态,代码的解释表,也可以称之为码表。比如地区表,订单类型,支付类型,商品类别...... ③事实表
阅读全文
posted @
2019-04-19 20:20
李昊宗
阅读(1612)
推荐(0)
03-数据仓库之拉链表
摘要:1、拉链表: ①记录每条信息的生命周期为单位 ②一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期作为此记录的生效日期 ③如果当前信息至今有效,在生效结束日期中填入一个极大值(如9999-12-31、9999-99-99) 用处: ①需要查看某些业务信息的某一个时间点当日的信息 ②数据
阅读全文
posted @
2019-04-19 20:15
李昊宗
阅读(1974)
推荐(0)
02-数据仓库之数据分层
摘要:1、数据仓库ETL https://www.cnblogs.com/yjd_hycf_space/p/7772722.html 2、数据仓库分层 ODS:原始数据层 数据来源可能是通过Flume监控、Sqoop导入....... Flume可以定义拦截器,进行数据ETL。 Sqoop可以通过sql语
阅读全文
posted @
2019-04-18 10:08
李昊宗
阅读(8426)
推荐(0)
01-数据仓库之数据建模
摘要:1、范式理论 范式:表示一个关系内部各属性之间的联系的合理化程度,范式级别越高,表的设计就越标准。 ①零范式 它只满足一个最基本的条件——数据中不存在重复数据。 ②一范式 在零范式的基础上加上字段具有原子性即属性不可分这个条件后便形成了符合一范式的表。基于 上面的保险订单统计表一范式和零范式的区别主
阅读全文
posted @
2019-04-17 20:08
李昊宗
阅读(1368)
推荐(0)