文章分类 -  大数据仓库理论

摘要:大数据仓库理论(二)Kettle+Sqoop+Azkaban+Impala 一、Kettle 1、Kettle的介绍 Kettle是一款开源的、元数据驱动的ETL工具集,是开源ETL工具里功能比较强大的一个。 Kettle需要对数据进行 抽取、转换、装入和加载 ,它的中文名字可以称为水壶。 其名字的 阅读全文

posted @ 2021-01-25 18:52 MissRong 阅读(2358) 评论(0) 推荐(0) |

摘要:大数据仓库理论(一)概念+架构+建模 一、关于数仓的一些概念 1、数仓定义 Bill Inmon -- 数据仓库之父,数据仓库概念的创始人。 数据仓库是一个支持管理决策的数据集合,是面向主题的、集成的、稳定的、反应历史变化的。 其中,主题是一个抽象的概念,每一个主题对应一个宏观的分析领域。 数据仓库 阅读全文

posted @ 2021-01-22 15:54 MissRong 阅读(1081) 评论(0) 推荐(0) |

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3