随笔分类 - MeachineLearning
摘要:首先,简单介绍下k-means聚类:效果简单有效,易于map—reduce化 算法思路:1、选择k个点作为原始的质心(k如何定) 2、将每个点指派到最近的质心,形成k个簇 3、重新计算每个簇的质心(x,y坐标的均值)--[新的质心不一定为样本点哦] 4、迭代2、3步直到簇心收敛于某一个阈值 优缺点:
阅读全文
摘要:1|—— rpart函数 shuttle数据集 数据集: 代码: 绘图: rpart.plot(b,type=1) rpart.plot(b,type=2) 分类的效果还是不错的,but这是数据洗的好啊... outcome: OUTCOME: _ tsamp集合 _samp集合
阅读全文
摘要:思路梳理: 决策树 |————Bagging[bootstrap抽样、投票分类] |————Boosting[bootstrap抽样、分错元组权重上升、分类器上也加权重进而判断] |————RandomForest[bootstrap抽样、n个特征找2~3个特种建树分类、Cart算法(基尼系数、不剪
阅读全文

浙公网安备 33010602011771号