随笔分类 -  数据挖掘

摘要:注:本文是《Mitchell机器学习》《JiaweiHan数据挖掘概念与技术》的学习笔记概览一1 ANN学习算法对于训练数据中的错误有非常好的健壮性,因此非常适合于这样的问题:训练集合为含有噪声的复杂传感器数据,例如来自摄像机和麦克风。2 ANN由一系列简单的单元相互密集连接构成,其中每个单元有一定数量的实值输入,并产生单一的实值输出。组成神经网络的几种主要单元包括:感知器,线性单元,sigmoid单元。3 感知器 I概念:输入实数值向量,计算其线性组合,结果大于某阈值输出1,否则输出-1。如下公式:或者:其中-w0是阈值。 II表征能力:即n维实例空间(点空间)中的超平面,或所有可能的实数值 阅读全文
posted @ 2011-01-29 17:30 zhaoqian 阅读(5015) 评论(1) 推荐(0)
摘要:注:本文是《Mitchell机器学习》《JiaweiHan数据挖掘概念与技术》的学习笔记概览一1 决策树就是实例属性值约束的合取的析取式。从树根到树叶的每一条路径对应一组属性测试的合取,树本身对应这些合取的析取。2 决策树建立时,使用统计测试来确定每一个实例属性单独分类训练样例的能力,在每个结点选取能最好地分类样例的属性,且从不回溯重新考虑以前的选择。因此,决策树学习是一个自顶向下的贪婪搜索算法。3 每一步都使用统计测试使决策树学习对错误有很好的健壮性。4 决策树学习的假设空间包含所有的决策树,它是关于现有属性的有限离散值函数的一个完整空间。每个有限离散值函数都可被表示为某个决策树。因此,决策 阅读全文
posted @ 2011-01-25 16:15 zhaoqian 阅读(9241) 评论(0) 推荐(0)