04 2018 档案

摘要:决策树分类 决策树分类归类于监督学习,能够根据特征值一层一层的将数据集进行分类。它的有点在于计算复杂度不高,分类出的结果能够很直观的呈现,但是也会出现过度匹配的问题。使用ID3算法的决策树分类第一步需要挑选出一个特征值,能够将数据集最好的分类,之后递归构成分类树。使用信息增益,来得到最佳的分类特制。 阅读全文
posted @ 2018-04-24 21:41 Shaw_LAU 阅读(2237) 评论(0) 推荐(1)
摘要:k-邻近算法是一种测量不同特征值之间距离来进行分类的一种算法。 該算法的优点是精度高,对异常的特征值不敏感,但是缺点也很明显,计算的复杂度高,计算空间复杂度也比较高。 k邻近算法就是 通过计算 目标点的特征值 与样本点的特征值 前k个距离最小的样本点的类别中概率最大的一个就是目标点的类别。 如上图 阅读全文
posted @ 2018-04-09 22:43 Shaw_LAU 阅读(1191) 评论(0) 推荐(0)