python人工智能——机器学习——分类算法-朴素贝叶斯算法

1、概率基础

2、朴素贝叶斯介绍

概率基础

概率定义为一件事情发生的可能性

联合概率和条件概率

在这里插入图片描述

朴素贝叶斯-贝叶斯公式

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

拉普拉斯平滑

如果词频列表里面有很多出现次数都为0,则会导致计算结果为0。
在这里插入图片描述

sklearn朴素贝叶斯实现API

sklearn.naive_bayes.MultinomialNB

MultinomialNB

sklearn.naive_bayes.MultinomialNB(alpha = 1.0)
	朴素贝叶斯分类
	alpha:拉普拉斯平滑系数

朴素贝叶斯分类优缺点

优点:
朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。
对缺失数据不太敏感,算法也比较简单,常用于文本分类。
分类准确度高,速度快

缺点:
需要知道先验概率P(F1,F2,…|C),因此在某些时候会由于假设的先验
模型的原因导致预测效果不佳。

posted @ 2019-02-15 10:56  AlexKing007  阅读(70)  评论(0编辑  收藏  举报