转:数据字典的三生三世
摘要:最近数据字典这个词经常跳出来,挑动着笔者的神经,搞了很多年的取数,报表、经分直至大数据,每每都会搞数据字典,但每每都难说成功,我们的数据字典都经历了三生三世啊,为什么还未成功? 第一代数据字典 首先,其往往零碎的散落在每个开发人员的设计文档中,或者长眠在文档服务器中,鲜有人去动它,找到一个简单的字段
阅读全文
posted @
2017-05-10 17:43
无尽的缥缈
阅读(377)
推荐(0)
转:一位阿里人对数据模型建设的几点思考与总结
摘要:走过2010年,回首走过的一年,全部精力投入到了数据平台的建设过程中,在不断的探索、尝试中探索一条适合数据仓库发展之路的数据模型建设方法;作为数据平台建设的主要驱动人,与团队一起完成数据平台基础数据模型(宽表层)的搭建,应用迁移、实现应用项目在新的数据模型上实施。在建设的过程中,有过困惑、走过弯路,
阅读全文
posted @
2016-12-02 10:37
无尽的缥缈
阅读(723)
推荐(0)
数据仓库系列4-范式2
摘要:前面讲了下3范式。 http://www.cnblogs.com/wujin/p/6098676.html 在这里简单的介绍下BCNF,四范式,五范式 BCNF 也叫作3.5范式。 主要是任何属性都不能依赖于非主属性。 第三范式的基础上,第三范式是非主属性只能依赖于主属性,所以也就是主属性不能依赖于
阅读全文
posted @
2016-12-01 19:32
无尽的缥缈
阅读(362)
推荐(0)
转浅谈数据仓库建设中的数据建模方法
摘要:此文来自于https://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0803zhousb/ 所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。目前业界较为主流的是数据仓库
阅读全文
posted @
2016-11-29 15:48
无尽的缥缈
阅读(547)
推荐(0)
数据仓库系列3-键
摘要:数仓模型是非常重要的,模型中键又是重中之重。 今天简单讨论一下键。 候选键包含主键 和可选建,主键可以作为其它表的外键。 主键的生成方式分为两类:自然键和代理键。 主键都比较好懂,就是唯一键,重点说一下自然键和代理键。 自然键和代理键的有啥区别呢? 自然键是已经真实存在的键,通常具有商业意义,比如e
阅读全文
posted @
2016-11-26 23:36
无尽的缥缈
阅读(1636)
推荐(0)
数据仓库系列4-范式
摘要:范式虽然在工作中没有很明确的用到,但是作为一个搞数据的人,时时刻刻在用着范式,虽然心里懂,但是每次别人问,都感觉说不出来的样子,为了加强进一步的理解,在这里简单的记录一下。 有一句话概括了3范式,比较容易理解,每一个非健值属性必须依赖于健,依赖于整个健而不是健的一部分,并且不依赖于其它非健值属性。
阅读全文
posted @
2016-11-24 17:26
无尽的缥缈
阅读(1113)
推荐(0)
数据仓库系列2-基本概念
摘要:说起数据仓库,肯定得提到建模,建模就必须得知道一些基本的概念。 1、实体 实体顾名思义就是真实的东西,因为建模就是把实际的东西通过数据模型表达出来,所以呢实体通常是名词,比如人,商店,房间等,都可以是实体。 实体对应到数据库中呢,就是一张表。一般通过一张表来描述一份实体。 实体呢也有很多分类,通常情
阅读全文
posted @
2016-11-21 21:49
无尽的缥缈
阅读(320)
推荐(0)
数据仓库系列1-高质量数据建模
摘要:一、前言: 虽然做数据工作5年了,从传统行业到互联网行业,感觉啥都懂点,但是没有一样可以拿出手的,干活时没问题,但是讲东西却存在问题,最近想系统的学习一下数据仓库只是,顺便记录下,也算是对学习的一个总结。 二、数据仓库 那么,何为数据仓库,根据百度百科介绍,数据仓库,英文名称为Data Wareho
阅读全文
posted @
2016-10-13 14:11
无尽的缥缈
阅读(581)
推荐(0)