摘要:
C4.5 算法: C4.5 算法核心思想是ID3 算法,是ID3 算法的改进。ID3 算法是以信息论为基础, 以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。ID3 算法计算每个属性的信息增益, 并选取具有最高增益的属性作为给定的测试属性。C4.5 算法的改进方面有: 1) 用信息增益率来 阅读全文
posted @ 2017-09-21 16:26
小天儿
阅读(341)
评论(0)
推荐(0)
摘要:
1. 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计 阅读全文
posted @ 2017-09-21 14:42
小天儿
阅读(221)
评论(0)
推荐(0)
摘要:
原文:http://www.ctocio.com/hotnews/15919.html 基于此原文做了扩展,比如加了细节和演示动画等 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方 阅读全文
posted @ 2017-09-21 12:34
小天儿
阅读(454)
评论(0)
推荐(0)