随笔分类 -  数据仓库

摘要:一.增量表,全量表,拉链表概念 1.增量表 记录更新周期内新增的数据,即在原表中数据的基础上新增本周期内产生的新数据; 2.全量表 记录更新周期内的全量数据,无论数据是否有变化都需要记录; 3.拉链表 一种数据存储和处理的技术方式,可以记录数据的历史信息,记录数据从开始一直到当前所有变化的信息。 二 阅读全文
posted @ 2020-11-11 14:51 Shmily_blog 阅读(1742) 评论(0) 推荐(0)
摘要:1.Hadoop分布式存储系统 1.Hadoop定义 一个由 Apache 基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File Syste 阅读全文
posted @ 2020-11-10 17:02 Shmily_blog 阅读(66) 评论(0) 推荐(0)
摘要:一. 什么是数据模型 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。 二. 维度建模的基本概念 维 阅读全文
posted @ 2020-11-10 16:06 Shmily_blog 阅读(275) 评论(0) 推荐(0)
摘要:《数据仓库》系列博文,是笔者在学习数据仓库与商业智能时的读书笔记,现分享在这里,希望读者批评指正。 在正式进入到数据仓库的知识之前,先说明一下数据库中的两种数据处理模式:操作型数据处理和分析型数据处理,又分别称为联机事务处理(OLTP)和联机分析处理(OLAP)。 (1)联机事务处理(OLTP) 是 阅读全文
posted @ 2020-11-10 15:26 Shmily_blog 阅读(320) 评论(0) 推荐(0)