摘要:
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值 阅读全文
posted @ 2016-10-10 22:00
白鹭倾城
阅读(4362)
评论(0)
推荐(0)
摘要:
决策树意义: 分类决策树模型是表示基于特征对实例进行分类的树形结构.决策树可以转换为一个if_then规则的集合,也可以看作是定义在特征空间划分上的类的条件概率分布. 它着眼于从一组无次序、无规则的样本数据(概念)中推理出决策树表示形式的分类规则.假设这里的样本数据应该能够用“属性—结论”.决策树学 阅读全文
posted @ 2016-10-10 21:30
白鹭倾城
阅读(2254)
评论(0)
推荐(0)
摘要:
#################################Weka-J48(C4.5)################################# ##############################R语言:C4.5############################### 阅读全文
posted @ 2016-10-10 18:01
白鹭倾城
阅读(1697)
评论(2)
推荐(0)
摘要:
逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型,得到的是0~1之间的概率分布.自变量范围是,值域范围限制在0~1之间.在搜索广告、信息处理和生物统计中有广泛的应用.例如搜索广告的点击率预估,将影响概率预测的各种信息作为变量,比如广告的位置、广告和搜索词的相关性、广告展示的时间(比如晚上广 阅读全文
posted @ 2016-10-10 17:54
白鹭倾城
阅读(824)
评论(0)
推荐(0)
摘要:
knn法是一种基本分类与回归方法 应用:knn算法不仅可以用于分类,还可以用于回归.. 1、文本分类:文本分类主要应用于信息检索,机器翻译,自动文摘,信息过滤,邮件分类等任务. 2、可以使用knn算法做到比较通用的现有用户产品推荐,基于用户的最近邻(长得最像的用户)买了什么产品来推荐是种介于电子商务 阅读全文
posted @ 2016-10-10 17:16
白鹭倾城
阅读(2035)
评论(0)
推荐(0)
摘要:
Naive Bayes: 简单有效的常用分类算法,典型用途:垃圾邮件分类 假设:给定目标值时属性之间相互条件独立 同样,先验概率的贝叶斯估计是 优点: 1、 无监督学习的一种,实现简单,没有迭代,学习效率高,在大样本量下会有较好的表现. 2、 对分类器的学习情况有着比较简单的解释,可以简单的通过查询 阅读全文
posted @ 2016-10-10 17:09
白鹭倾城
阅读(853)
评论(0)
推荐(0)

浙公网安备 33010602011771号