11 2018 档案
机器学习实战(2)-决策树
摘要:构建决策树最重要的是分裂属性的选取,重要的是每个属性在节点的位置,比如说第一个节点属性为什么是A而不是B。分裂属性就是在某个节点处按照某一特征属性的不同划分构造不同的分支,其目标是让各个分裂子集更加的纯,所谓的纯是指尽量让一个分裂子集中待分类项属于同一类别。判断纯的方法有ID3,C4.5,CART算 阅读全文
posted @ 2018-11-16 17:55 卡贝天师 阅读(203) 评论(0) 推荐(0)
机器学习实战(1)- KNN
摘要:KNN:k近邻算法-在训练样本中找到与待测样本距离相近的N个样本,并用这N个样本中所属概率最大的类别作为待测样本的类别。 算法步骤: 1、对训练中的样本数据的不同属性进行归一化处理。 2、计算待测样本到训练样本集中的距离。(欧拉距离或曼哈顿距离); 3、找到N个距离最小的样本属于不同类别的概率。 4 阅读全文
posted @ 2018-11-12 15:04 卡贝天师 阅读(323) 评论(0) 推荐(0)