Hadoop小结们

摘要: 数仓 数据仓库是一个面向主题的、集成的、随着时间变化的、非易失的数据集合,用于支持管理者的决策过程。 数据仓库中的力度是指数据的细节或汇总程度,细节程度越高,粒度几倍越低。 数据仓库的数据来自各个业务应用系统。 很多因素导致直接访问业务系统无法进行全局数据分析工作,这也是需要一个数据仓库的原因所在。 阅读全文
posted @ 2019-07-15 17:54 菲菲菲非常可爱的小白兔 阅读(109) 评论(0) 推荐(0)

Hadoop构建数据仓库实践读书笔记【3】--抽取转换装载

摘要: ETL Exract Transform Load 抽取、转换、装载。 ETL 是建立数据仓库最重要的处理过程,也是最体现工作量的环节,一般会占用到整个数据仓库项目工作量的一半以上。 抽取:从操作型数据源获取数据。 转换:转换数据,使之转变为适用于查询和分析的形式和结构。 装载:将转换后的数据导入最 阅读全文
posted @ 2019-07-15 17:17 菲菲菲非常可爱的小白兔 阅读(328) 评论(0) 推荐(0)

python 简单的线性比对数据

该文被密码保护。 阅读全文
posted @ 2019-07-15 15:43 菲菲菲非常可爱的小白兔 阅读(1) 评论(0) 推荐(0)