随笔分类 -  MeachineLearning

摘要:首先,简单介绍下k-means聚类:效果简单有效,易于map—reduce化 算法思路:1、选择k个点作为原始的质心(k如何定) 2、将每个点指派到最近的质心,形成k个簇 3、重新计算每个簇的质心(x,y坐标的均值)--[新的质心不一定为样本点哦] 4、迭代2、3步直到簇心收敛于某一个阈值 优缺点: 阅读全文
posted @ 2016-07-06 19:43 叶乙 阅读(7527) 评论(0) 推荐(0)
摘要:1|—— rpart函数 shuttle数据集 数据集: 代码: 绘图: rpart.plot(b,type=1) rpart.plot(b,type=2) 分类的效果还是不错的,but这是数据洗的好啊... outcome: OUTCOME: _ tsamp集合 _samp集合 阅读全文
posted @ 2016-06-27 15:52 叶乙 阅读(287) 评论(0) 推荐(0)
摘要:思路梳理: 决策树 |————Bagging[bootstrap抽样、投票分类] |————Boosting[bootstrap抽样、分错元组权重上升、分类器上也加权重进而判断] |————RandomForest[bootstrap抽样、n个特征找2~3个特种建树分类、Cart算法(基尼系数、不剪 阅读全文
posted @ 2016-06-26 21:56 叶乙 阅读(138) 评论(0) 推荐(0)