【大数据-课程】高途-天翼云侯圣文-Day2:离线数仓搭建分解
一、内容介绍
昨日福利:大数据反杀熟


今日:数据看板
离线分析及DW数据仓库
明日:实时计算框架及全流程


一、数仓定义及演进史
1、概念

生活中解答

2、数据仓库的理解


对比商品仓库

3、数仓分层内容

(1)层数不要过多,会冗余

(2)好处
提高效率,便于复用
4、数仓的演进过程
(1)演进

OLTP->OLAP维度建模,冗余
关系建模:高度结构化,易于扩展
(2)对比

OLTP善于交易
OLAP善于检索
5、数据仓库架构

实时计算,杀熟,比你更懂你
例如拼多多,游戏让你消费
二、具体了解
1、模型介绍

2、分层
书店、商场等都有分层

三、数仓建模流程介绍
1、数据调研

2、数仓规划


3、模型设计

4、模型开发

四、实战演示
1、概述

2、工具介绍


阿里的quick BI快速构建大宽表,托拉拽


HQL写DW,不同层有冗余,但是查询数据更方便
Scala写flink


3、课程内容

阿里ACP职业认证


本文来自博客园,作者:哥们要飞,转载请注明原文链接:https://www.cnblogs.com/liujinhui/p/15925196.html

浙公网安备 33010602011771号