随笔分类 -  数仓

摘要:数据仓库之拉链表(原理、设计以及在Hive中的实现) 本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。 全文由下面几个部分组成: 先分享一下拉链表的用途、什么是拉链表。 通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。 阅读全文
posted @ 2021-06-15 12:26 温家三哥 阅读(930) 评论(0) 推荐(0)
摘要:一、概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图 1 。 星型架构 阅读全文
posted @ 2021-05-15 21:02 温家三哥 阅读(9387) 评论(0) 推荐(0)
摘要:Kimball和Inmon是两种主流的数据仓库方法论,两者各有优势。本文简要的做一些比较,以帮助数据仓库实践。 1 Inmon数据仓库Inmon数据仓库采用自上而下的方法。它将数据仓库定义为整个企业级的集中存储。数据仓库存放着最低的详细级别的原子数据。维度数据集市只是在数据仓库完成后才创建的。因此, 阅读全文
posted @ 2021-04-18 23:39 温家三哥 阅读(371) 评论(0) 推荐(0)
摘要:文章来源于公众号:选型宝订阅号 图说:安筱鹏博士在清华大学经管学院 举办的高教论坛上现场发言。 各位来宾上午好! 在座的各位都是清华经管学院的校友,非常高兴在清华108年校庆期,和各位清华校友交流数字化转型这个话题。今天,我们业界关于企业数字化转型有很多新的概念,有些时候新概念太多,也造成了“新概念 阅读全文
posted @ 2021-04-18 23:32 温家三哥 阅读(1434) 评论(0) 推荐(0)
摘要:数据仓库之数据模型 关于数据仓库的概念,这里不再累赘。先看下面的图(数据仓库建设的7个主要环节): 本文,主要针对第三块数据仓库模型设计来讨论交流,尤其是互联网行业。 一、关于数据仓库数据模型 1. 数据仓库数据模型是指使用实体、属性及其关系对企业运营和逻辑规则进行统一的定义、编码和命名;是业务人员 阅读全文
posted @ 2021-04-18 23:11 温家三哥 阅读(908) 评论(0) 推荐(0)
摘要:数仓建模之设计与开发 1. 数据模型入门 1).数据模型概念 数据模型的定义:数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。读起来有些拗口,可以简单理解为描述实体及关系的一个方法。 2).数据模型意义 引入数据模型,是为了 阅读全文
posted @ 2021-04-18 23:07 温家三哥 阅读(795) 评论(0) 推荐(0)
摘要:数据仓库 之 数据建模理论 数据仓库建模理论就像大厦的地基,只有把建模理论理解清楚,在数据建模时才能有理有据。作为一个数据仓库开发人员,数据建模理论是我们必须要掌握和理解的一部分,只要充分理解了数据建模理论知识,在建设数据仓库时我们就可轻松上手。 数据建模理论 数据仓库的两大模式:Kimball维度 阅读全文
posted @ 2021-04-18 23:00 温家三哥 阅读(1210) 评论(0) 推荐(0)