专注于中国的商业智能

导航

2010年8月4日 #

Kimball 设计技巧导读(一)

摘要: Kimball Group每个月会通过email发布一个设计技巧。下面是其中部分设计技巧的整理,因为是根据自己的理解翻译的,肯定会有很多不足之处。对其中内容翻译不清的地方可以和我联系,大家共同探讨,或者直接参照原文。Kimball的网站上有2006年及以前的全部原文下载,2007年的也可以通过email订阅。具体方式请参阅Kimball的网站。KDT#1 建立点击流数据仓库的一些指导KDT#1补充... 阅读全文

posted @ 2010-08-04 17:42 李梦蛟 阅读(1231) 评论(0) 推荐(1) 编辑

数据仓库概念浅析

摘要: 下面列出的数据仓库中常见的概念的简单解释,按中文字母排序。冰山查询――iceberg query操作集市――oper mart操作数据存储――operational data store代理关键字--surrogate key多值维度――multivalue dimension非事实型事实表――factless fact table合并事实表--consolidated/ merged fact ... 阅读全文

posted @ 2010-08-04 16:26 李梦蛟 阅读(1298) 评论(0) 推荐(0) 编辑

维度建模中的数据存储

摘要: Dimensional Relational vs. OLAP: The Final Deployment Conundrumby Ralph Kimball,2007年4月27日在维度建模的数据仓库之中,是使用关系数据库来保存数据还是使用OLAP Cube来保存数据是一个需要数据仓库架构师作出选择的问题。本文是Kimall先生对此问题的阐释,文中列举了两种可选方式的34条优点和缺点,供大家参考。... 阅读全文

posted @ 2010-08-04 16:05 李梦蛟 阅读(490) 评论(0) 推荐(0) 编辑

浅析操作数据存储(六)

摘要: 一个和操作数据存储(ODS)常混淆的概念就是数据准备区(Data Staging Area)。很多人把供数据迁移的数据准备区称为ODS。事实上,ODS和Staging Area有着较为明显的不同。ODS和数据准备区最大的区别就是,ODS是支持用户访问的,而数据准备区是不支持用户访问的。数据准备区包括一组数据迁移的程序和为了清洗数据而建立一组表结构及表中的数据。数据准备区是介于源系统和数据仓库之间的... 阅读全文

posted @ 2010-08-04 15:44 李梦蛟 阅读(306) 评论(0) 推荐(0) 编辑

浅析操作数据存储(二)

摘要: Inmon在给ODS下了定义之后,进一步把ODS分成了四类。根据数据到达ODS的时间间隔,即数据从操作型系统生成开始到数据到达ODS为止的时间长短,ODS分为Class I、Class II、Class III和Class IV四类。Class I的ODS指时间间隔为秒级,即对用户来说,ODS是个透明的部件,操作型系统业务发生后,数据立刻就可以在ODS中看到。这类ODS事实上是很难实现的。秒级的数... 阅读全文

posted @ 2010-08-04 15:43 李梦蛟 阅读(272) 评论(0) 推荐(0) 编辑

浅析操作数据存储(一)

摘要: 在数据仓库架构中有一种部件叫Operational Data Store(ODS),中文一般翻译为“操作数据存储”。操作数据存储在通常的数据仓库架构中都是一个可选的部件,它和数据仓库起到互相补充的作用。最早给ODS下定义的应该是数据仓库之父Inmon。他的定义是,操作数据存储(ODS)是面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用来满足企业综合的、集成... 阅读全文

posted @ 2010-08-04 15:43 李梦蛟 阅读(410) 评论(0) 推荐(0) 编辑

浅析操作数据存储(四)

摘要: 到了2006年,Inmon提出了他的下一代数据仓库架构--DW2.0,并在该架构中提出了虚拟操作数据存储(Virtual Operational Data Store,VODS)的概念。在DW2.0中,VODS是在EDW之外的一个部件,它和EDW中的交互区(Interactive Sector)是互补的关系。VODS是为某些特定的查询而准备的一种架构方式,它面对的查询需求是一次性的(One Tim... 阅读全文

posted @ 2010-08-04 15:43 李梦蛟 阅读(279) 评论(0) 推荐(0) 编辑

浅析操作数据存储(三)

摘要: Class I的ODS是实时数据仓库的一种实现方式。Class II和Class III的ODS是比较通常的ODS实现方式。Class IV的ODS非常有用的一类ODS实现方式。在Class IV的ODS中,最为常见的记录就是从数据仓库中总结出来的概况数据(Profile Record)。概况数据是数据情况的大纲。以客户为例,可以总结的概况数据如下:每月买衣服的件数,每周的销售量,每年会看两次眼科... 阅读全文

posted @ 2010-08-04 15:43 李梦蛟 阅读(256) 评论(0) 推荐(0) 编辑

浅析操作数据存储

摘要: 操作数据存储是一个有较大争议的数据仓库部门,本日志是去年对操作数据存储的情况的一些整理。从目前的情况来看,操作数据存储的发展方向就是实时数据仓库。1.Inmon对操作数据存储的定义2.四类操作数据存储简介3.第四类操作数据存储的例子4.DW2.0中的虚拟操作数据存储5.Kimball对操作数据存储的定义6.操作数据存储和数据准备区的区别7.个人对操作数据存储的观点本日志整理于Inmon和Kimba... 阅读全文

posted @ 2010-08-04 15:42 李梦蛟 阅读(433) 评论(0) 推荐(0) 编辑

浅析操作数据存储(七)

摘要: 下面谈谈个人对操作数据存储(ODS)的一些观点。首先要谈的是ODS的位置和作用。ODS应该位于源系统和数据仓库之间的一个独立部件,它的作用是给用户提供一些在源系统和数据仓库系统都不适合完成的功能。置于ODS应该对用户提供什么样的功能,我觉得没必要过于死板,可以根据自己的需要来定。ODS应该是面向主题的。这一点我觉得是有必要的,ODS名称中虽然有操作两个字,但是它的目的主要还是查询和分析。所以面向主... 阅读全文

posted @ 2010-08-04 15:42 李梦蛟 阅读(269) 评论(0) 推荐(0) 编辑

浅析操作数据存储(五)

摘要: Kimball对操作数据存储的定义是,面向主题的、集成的、经常更新的细节数据存储,用集成的数据来支持事务系统。Kimball也认可Inmon对ODS的分类,但是他认为ODS应该以星型结构来进行建模。虽然Kimball对操作数据存储(ODS)的定义和Inmon基本上一样,但是他对操作数据存储的理解、作用与实现和Inmon有着较大的不同。Kimball认为ODS在两种情况下是需要的:第一种情况是提供操... 阅读全文

posted @ 2010-08-04 15:42 李梦蛟 阅读(307) 评论(0) 推荐(0) 编辑