摘要: 对于许多人来说数据库的概念可谓耳熟能详,但当涉及到数据仓库的时候大多数人可能就不是那么熟悉了。在本节中主要从数据仓库的概念(什么是数据仓库)、数据仓库如何构建、数据仓库提出的意义(数据仓库在实际中的应用)三个方面展开。1.何为数据仓库(Data Warehouse) William H. I... 阅读全文
posted @ 2014-09-10 17:04 风雨IT路 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 在数据预处理的过程当中往往需要将多个数据集合中的数据整合到一个数据仓库中,即:需要对数据库进行集成。与此同时,为了更好地对数据仓库中的数据进行挖掘,对数据仓库中的数据进行变换也在所难免。本文主要针对数据集成以及数据变化两个问题展开论述。数据集成在将多个数据库整合为一个数据库过程中存在需要着重解决三个... 阅读全文
posted @ 2014-08-25 22:40 风雨IT路 阅读(3360) 评论(0) 推荐(0) 编辑
摘要: 数据清洗:数据清洗作为数据预处理中的一个步骤,主要用于处理由于数据仓库中数据不完整、数据噪声以及数据不一致导致的问题。有人可能质疑,为什么要对数据进行清洗?忽略那些出问题的数据不行吗?当然,视而不见确是一种应对策略,但作为数据挖掘中的一环,没有高质量的数据又谈何挖掘的可信性。为此,对于数据数据挖掘来... 阅读全文
posted @ 2014-08-25 17:19 风雨IT路 阅读(2286) 评论(0) 推荐(0) 编辑
摘要: 数据预处理(Data Preprocess):通过采用数据清理、数据集成与变换以及数据规约等方法对数据预先进行处理,处理后的数据用于数据挖掘。在当前社会中,由于大数据、数据源不唯一等原因使得在真实数据库存放的数据存在噪声、缺失和不一致的问题。基于数据的信息挖掘在数据不能保证的情况下,挖掘得到的信息也... 阅读全文
posted @ 2014-07-31 15:57 风雨IT路 阅读(950) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘(Data Mining):指的是从大数据中获取有用的信息。从另一个角度来说,可以把它理解为信息技术自然进化过程中的产物。正如图1.1(来源于Data mining concepts and techniques一书中)中所呈现,数据库系统的发展历程经历了一下几个阶段:1)数据储存和数据库创... 阅读全文
posted @ 2014-07-30 21:53 风雨IT路 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 下面两个网站是学习数据挖掘常用论坛网站:http://www.businessanalysis.cn/forum-30-1.htmlhttp://www.businessanalysis.cn/portal.php 阅读全文
posted @ 2014-07-27 10:57 风雨IT路 阅读(208) 评论(0) 推荐(0) 编辑