AYE89

coding & learning

导航

sklearn.naive_bayes中几种朴素贝叶斯分类器

Posted on 2017-08-21 22:37  AYE89  阅读(2904)  评论(0编辑  收藏  举报

区别:

几种朴素贝叶斯分类器的区别在于对于分布的假设,即假设满足的形式。

一、高斯NB

导入

from sklearn.naive_bayes import GaussianNB

假设特征的似然函数满足,

\sigma_y 和 \mu_y采用“最大似然估计” 

 

二、Multinomial NB

导入

from sklearn.naive_bayes import MultinomialNB

 特征是离散值,通常用样本的概率去估计

为避免有的特征值缺省,一般对样本的概率做Laplace平滑:(a=1时)

 

三、Bernoulli NB

原型

class sklearn.naive_bayes.BernoulliNB(alpha=1.0binarize=0.0fit_prior=Trueclass_prior=None)

假设特征的似然满足多元Bernoulli分布,每个特征是一个二值变量

 

Bernoulli NB判别准则满足:

区别于Multinomial NB

 

有文献证明,在短文本分类上Bernoulli NB可能优于Multinomial NB