数据挖掘概念与技术(第一章)
摘要:什么激发了数据挖掘,为什么它是重要的?决策者缺乏从海量数据中提取有价值知识的工具,我们希望重要的决策是基于数据储存仓库中信息丰富的数据,而不是基于决策者的直觉。数据仓库技术包括数据清理、数据集成和联机分析处理(OLAP)。什么是数据挖掘?简单说,从大量数据中提取或“挖掘”知识。数据挖掘作为知识发现过程的一个步骤。 数据库 数据清理(消除噪声和不一致数据),数据集成(多种数据源可以组合在一起) 数据仓库 数据选择(从数据库中提取与分析任务相关的数据)数据变换(数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作)数据挖掘(基本步骤,使用智能方法提取数据模式)模式评估(根据某种兴趣度度量,识别表示
阅读全文
posted @
2011-03-20 22:50
pandy
阅读(372)
推荐(1)
P&NP&NPC
摘要:1.P类问题:如果一个问题可以找到一个能在多项式的时间里解决它的算法。2.NP问题:指可以在多项式的时间里验证一个解的问题。The halting Problem是NP问题,所有的P类问题都是NP问题。3.NPC问题:(1)它是一个NP问题;(2)所有的NP问题都能归约到它(例:逻辑电路问题);既然所有的NP问题都能归约成NPC问题,那么只要任意一个NPC问题找到了一个多项式的算法,那么所有的NP问题都能用这个算法解决了,NP也就等于P了。因此,说:“正是NPC问题的存在,使人们相信P不等于NP。”NPC问题目前没有多项式的有效算法,只能用指数级或阶乘级复杂度的搜索。4.NP-Hard问题:所
阅读全文
posted @
2011-01-17 13:54
pandy
阅读(357)
推荐(0)