文章分类 -  数据仓库工程师

我为数据建房子
DB2索引类型介绍
摘要:DB2数据库中都有哪些索引类型呢?下面就为您分类介绍DB2索引类型,如果您是刚刚接触DB2数据库的新人,不妨一看。DB2索引类型:在介绍索引类型前介绍一下关于稠密度的概念.稠密度定义:在数据分布均匀的情况下,稠密度=数据分布的可能数/数据总条数。例如:表1中有索引1在列1上,其中列1的数据分布有10中,分别是1-10,数据接近均匀分布,总数据量为1000,则该索引的稠密度=100/1000=10%,稠密度最高为1。稠密度越小,索引的选择性越大,查询性能越好。(1)非唯一索引可以说大部分的索引的非唯一索引,这和数据的分布有关系,一般的数据都具有可重复性特性,所以他们不能被定义为唯一索引。非唯一索 阅读全文
posted @ 2013-12-30 18:22 幻影11 阅读(2508) 评论(0) 推荐(0)
DB2索引创建原则
摘要:DB2索引创建都应该哪些原则呢?这是很多人都提到的问题,下面就为您详细介绍DB2索引创建原则,供您参考学习。DB2索引实现是一个B+树,通过索引可以实现快速查询,避免全表扫描以此来减少IO操作。索引是对表数据的一种抽象,通过抽取有限数据,对数据的分布进行计算,以此来完成对数据的快速检索。索引创建语句CREATEINDEXON()创建索引需要注意的地方:索引应该用来提高查询速度,但是会对更新和删除操作带来负面影响,因为要同步更新索引。所以索引应该创建到更新、删除相对比读取少的表上。索引需要独立的空间进行存储和管理。索引是需要磁盘空间来存储。所以避免重复创建冗余索引。如下:“CREATETABLE 阅读全文
posted @ 2013-12-30 18:03 幻影11 阅读(3866) 评论(0) 推荐(0)
数据仓库建设快速入门(二)---事实表和维度表的设计
摘要:2013-03-27 转载来源:http://www.cnblogs.com/47613593/archive/2009/02/19/1393971.html仅供学习方便。数据仓库的物理模型较常见的操作型数据库的物理模型有很大不同。最明显的区别是:操作型数据库主要是用来支撑即时操作,对数据库的性能和质量要求都比较高,为了防止“garbage in,garbage out”,通常设计操作型数据库的都要遵循几个范式的约束,除非少数情况下为了性能进行妥协,才可能出现冗余。而数据仓库的建立并不上为了支撑即时操作,或者说,数据仓库的数据是来源于即时操作产生的数据,而不是直接来源于即时操作。所以它的数据质 阅读全文
posted @ 2013-03-27 17:06 幻影11 阅读(424) 评论(0) 推荐(0)
数据仓库建设快速入门(一)---概念
摘要:2013-03-27 转载来源:http://www.cnblogs.com/47613593/archive/2009/02/19/1393971.html仅供学习方便。根据Bill.Inmon的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统”。我的理解是,数据仓库特点是操作型数据库的延伸,用于归档主题的历史信息,可以温故而知新。下面列举一些引自http://www.1keydata.com/datawarehousing/glossary1.html的一些概念解释:ETL: Stands for Extraction, Transformation 阅读全文
posted @ 2013-03-27 17:03 幻影11 阅读(180) 评论(0) 推荐(0)