Naive Bayes理论与实践

Naive Bayes:

简单有效的常用分类算法,典型用途:垃圾邮件分类

假设:给定目标值时属性之间相互条件独立

 

 

同样,先验概率的贝叶斯估计是

 

 

优点:

1、 无监督学习的一种,实现简单,没有迭代,学习效率高,在大样本量下会有较好的表现.

2、 对分类器的学习情况有着比较简单的解释,可以简单的通过查询学习时计算的一些概率值来了解其分类原理.

 

缺点:

1、 假设太强——假设特征条件独立,在输入向量的特征条件有关联的场景下并不适用.

 

#################################Weka###############################

 

 

######################R语言##################################

##########klaR包中的NaiveBayes函数,因为该函数较之前者增加了两个功能,一个是可以输入先验概率,另一个是在正态分布基础上增加了核平滑密度函数###################

library(klaR)

data(iris)

mN <- NaiveBayes(Species ~ ., data = iris)

plot(mN)

posted @ 2016-10-10 17:09  白鹭倾城  阅读(809)  评论(0编辑  收藏  举报