摘要:1. 随机森林使用背景1.1 随机森林定义随机森林是一种比较新的机器学习模型。经典的机器学习模型是神经网络,有半个多世纪的历史了。神经网络预测精确,但是计算量很大。上世纪八十年代 Breiman等人发明分类树的算法(Breiman et al. 1984),通过反复二分数据进行分类或回归,计算量大大...
阅读全文
摘要:http://blog.csdn.net/xianlingmao/article/details/7340099《理解共轭先验》如果你读过贝叶斯学习方面的书或者论文,想必是知道共轭先验这个名词的。现在假设你闭上眼睛,你能准确地说出共轭分布是指哪个分布和哪个分布式共轭的吗?我之前就常常把这个关系弄错,...
阅读全文
摘要:HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden Research Cent...
阅读全文
摘要:转自:http://www.letiantian.me/2014-10-12-three-models-of-naive-nayes/朴素贝叶斯是一个很不错的分类器,在使用朴素贝叶斯分类器划分邮件有关于朴素贝叶斯的简单介绍。若一个样本有n个特征,分别用[latex]x_{1},x_{2},...,x...
阅读全文
摘要:转自:http://blog.163.com/jiayouweijiewj@126/blog/static/1712321772010102802635243/琢 磨了两天,对于朴素贝叶斯的原理弄得很清楚,可是要做文本分类,看了好多文章知道基于朴素贝叶斯公式,比较出后验概率的最大值来进行分类,后验概...
阅读全文
摘要:转自http://blog.csdn.net/lch614730/article/details/17031145朴素贝叶斯分类算法(Naive Bayesian classification)PS:本文在讲解的时候会用通俗的例子来讲解本文我们将学习到:(1)什么是朴素贝叶斯?(2)先验概率和条件概...
阅读全文