随笔分类 -  数据挖掘

摘要:注:实验代码与数据集下载链接简介:PCA(Principal Component Analysis)主成分分析算法,在进行图像识别以及高维度数据降维处理中有很强的应用性,算法主要通过计算选择特征值较大的特征向量来对原始数据进行线性变换。一般获取的原始数据维度都很高,比... 阅读全文
posted @ 2018-05-31 15:55 keepgoon 阅读(954) 评论(0) 推荐(0)
摘要:数据对象与属性类型 数据集由数据对象组成。一个数据对象代表一个实体。例如,在销售数据库中,对象可以是顾客、商品或销售;在医疗数据库中,对象可以是患者;在大学的数据库中,对象可以是学生、教授和课程。 通常,数据对象用属性描述。数据对象又称样本、实例、数据点或对... 阅读全文
posted @ 2017-11-14 17:43 keepgoon 阅读(1910) 评论(0) 推荐(0)
摘要:作为一个应用驱动的学科,数据挖掘已经在许多应用中获得巨大成功。我们不可能一一枚举数据挖掘扮演关键角色的所有应用。在知识密集的应用领域,如生物信息学和软件工程,数据挖掘的表现更需要深人处理,这已经超出本书的范围。应用作为数据挖掘研究与开发的主要方面,其重要性不言而喻... 阅读全文
posted @ 2017-11-13 16:49 keepgoon 阅读(264) 评论(0) 推荐(0)
摘要:作为一个应用驱动的领域,数据挖掘吸纳了诸如统计学、机器学习、模式识别、数据库和数据仓库、信息检索、可视化、算法、高性能计算和许多应用领域的大量技术(见图i. m )。数据挖掘研究与开发的边缘学科特性极大地促进了数据挖掘的成功和广泛应用。本节我们给出一些对数据挖掘方法的... 阅读全文
posted @ 2017-11-09 21:09 keepgoon 阅读(341) 评论(0) 推荐(0)
摘要:作为一种通用技术,数据挖掘可以用于任何类型的数据,只要数据对目标应用是有意义的。 对于挖掘的应用,数据的最基本形式是数据库数据、数据仓库数据和事务数据。数据挖掘也可以用于其他类型的数据(例如,数据流、有序/序列数据、图或网络数据、空间数据、文本数据、多媒体数据和万维网... 阅读全文
posted @ 2017-11-09 20:10 keepgoon 阅读(980) 评论(0) 推荐(0)
摘要:毫不奇怪,作为一个多学科领域,数据挖掘可以用多种方法定义。即使术语“数据挖掘”本身实际上也不能完全表达其主要含义。从矿石或砂子中挖掘黄金称做黄金挖掘,而不是砂石挖掘。类似地,数据挖掘应当更正确地命名为“从数据中挖掘知识”,不幸的是这有点长。然而,较短的术语“知识挖掘”... 阅读全文
posted @ 2017-11-08 22:33 keepgoon 阅读(687) 评论(0) 推荐(0)