飞鸟各投林

导航

随笔分类 - 机器学习实战

第十四章:降维:奇异值分解SVD
摘要: 阅读全文

posted @ 2016-05-01 20:25 飞鸟各投林 阅读(275) 评论(0) 推荐(0) 编辑

第十三章:降维:主成分分析PCA
摘要:第13章:利用PCA来简化数据 阅读全文

posted @ 2016-05-01 20:18 飞鸟各投林 阅读(244) 评论(0) 推荐(0) 编辑

第十二章:使用FP-growth算法进行关联分析
摘要: 阅读全文

posted @ 2016-05-01 20:09 飞鸟各投林 阅读(201) 评论(0) 推荐(0) 编辑

第十一章:使用Apriori算法进行关联分析
摘要: 阅读全文

posted @ 2016-05-01 20:04 飞鸟各投林 阅读(177) 评论(0) 推荐(0) 编辑

第十章:聚类
摘要: 阅读全文

posted @ 2016-05-01 19:55 飞鸟各投林 阅读(181) 评论(0) 推荐(0) 编辑

第九章:树回归
摘要: 阅读全文

posted @ 2016-05-01 19:46 飞鸟各投林 阅读(218) 评论(0) 推荐(0) 编辑

第八章:预测数值型数据:回归
摘要:本章内容□ 线性回归□ 局部加权线性回归□ 岭回归和逐步线性回归□ 预测鲍鱼年龄和玩具售价 8.1用线性回归找到最佳拟合直线 阅读全文

posted @ 2016-05-01 19:36 飞鸟各投林 阅读(230) 评论(0) 推荐(0) 编辑

第七章:利用AdaBoost元算法提高分类性能
摘要:本章内容□ 组合相似的分类器来提髙分类性能□应用AdaBoost算法□ 处理非均衡分类问题 7.1基于数据集多重抽样的分类器 阅读全文

posted @ 2016-05-01 19:21 飞鸟各投林 阅读(150) 评论(0) 推荐(0) 编辑

第六章:支持向量机
摘要:本章内容□简单介绍支持向量机□ 利用SMO进行优化□利用核函数对数据进行空间转换□ 将SVM和其他分类器进行对 6.2寻找最大间隔 6.5 在复杂数据上应用核函数 阅读全文

posted @ 2016-05-01 17:20 飞鸟各投林 阅读(222) 评论(0) 推荐(0) 编辑

第五章:Logistic回归
摘要:本章内容 □sigmod函数和logistic回归分类器 □最优化理论初步□梯度下降最优化算法□数据中的缺失项处理 这会是激动人心的一章,因为我们将首次接触到最优化算法。仔细想想就会发现,其实我们日常生活中遇到过很多最优化问题,比如如何在最短时间内从入点到达氏点?如何投人最少工作量却获得最大的效益? 阅读全文

posted @ 2016-05-01 16:40 飞鸟各投林 阅读(530) 评论(0) 推荐(0) 编辑

第四章:基于概率论的分类方法: 朴素贝叶斯
摘要:本章内容□使用概率分布进行分类□学习朴素贝叶斯分类器□解析RSS源数据口使用朴素贝叶斯来分析不同地区的态度 前两章我们要求分类器做出艰难决策,给出“该数据实例属于哪一类”这类问题的明确答案。不过,分类器有时会产生错误结果,这时可以要求分类器给出一个最优的类别猜测结果,同时给出这个猜测的概率估计值。 阅读全文

posted @ 2016-05-01 15:33 飞鸟各投林 阅读(1088) 评论(0) 推荐(0) 编辑

第三章:决策树
摘要:本章内容□ 决策树简介□ 在数据集中度量一致性□ 使用递归构造决策树□ 使用matplotlib绘制树形图 我们经常使用决策树处理分类问题近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行,一个很重要的原因就是使用者基本上不用了解机器学习算法,也不用深究它是如何工作的。 第2章介绍的 阅读全文

posted @ 2016-05-01 11:19 飞鸟各投林 阅读(541) 评论(0) 推荐(0) 编辑

第二章:k-近邻算法
摘要:本章内容k-近邻分类算法从文本文件中解析和导人数据 使用Matplotlib创建扩散图归一化数值 2.1 k-近邻算法概述简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。 本书讲解的第一个机器学习算法是k 近邻算法(kNN ) , 它的工作原理是:存在一个样本数据集合,也称作训练样本 阅读全文

posted @ 2016-04-30 22:08 飞鸟各投林 阅读(465) 评论(0) 推荐(0) 编辑

第一章:机器学习基础
摘要:第一部分:分类 本书前两部分主要探讨监督学习(supervisedieaming)。在监督学习的过程中,我们只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目标变量的结果。 监督学习一般使用两种类型的目标变量:标 阅读全文

posted @ 2016-04-30 20:04 飞鸟各投林 阅读(760) 评论(0) 推荐(0) 编辑

KNN算法的感受 2
摘要:(1):先将上述代码保存为kNN.py (2):再在IDLE下的run菜单下run一下,将其生成python模块 (3):import kNN(因为上一步已经生成knn模块) (4):kNN.classify0([0,0],group,labels,3) (讨论[0,0]点属于哪一个类) 注:其中【 阅读全文

posted @ 2016-04-09 23:54 飞鸟各投林 阅读(276) 评论(0) 推荐(0) 编辑

KNN算法的感受 1
摘要:本来预计的打算是一天一个十大挖掘算法,然而由于同时要兼顾数据结构面试的事情,所以 很难办到,但至少在回家前要把数据挖掘十大算法看完,过个好年,在course上学习老吴的课程还是帮了我很大的忙,虽然浪费了时间,但是也无形中帮助我 很多,所以说还是很值得的,今天就总结KNN算法的一部分,这部分老吴的课程 阅读全文

posted @ 2016-04-09 23:53 飞鸟各投林 阅读(772) 评论(0) 推荐(0) 编辑

Matplotlib安装感想
摘要:刚刚安装完numpy,看完书又涉及到matplotlib,哎,安装它浪费了我很多时间,但收获很多呀 下面介绍一下具体的安装过程: (1)http://matplotlib.org/downloads.html 可以选择pypi或者sourceforge选择下载 我选择 sourceforge,点击后 阅读全文

posted @ 2016-04-09 23:45 飞鸟各投林 阅读(204) 评论(0) 推荐(0) 编辑

安装numpy只需一步简单的方法
摘要:因为最近在搞机器学习,涉及到python,因为我的python版本还是windoes下的2.7版本,在学习K临近算法的时候,需要安装numpy函数,下面就把自己的安装方法写下来 1:登录网址 http://sourceforge.net/projects/numpy/files/NumPy/ 2:下 阅读全文

posted @ 2016-04-09 23:28 飞鸟各投林 阅读(424) 评论(0) 推荐(0) 编辑