分类与监督学习，朴素贝叶斯分类算法

一.

1.理解分类与监督学习、聚类与无监督学习。

简述分类与聚类的联系与区别。

简述什么是监督学习与无监督学习。

答：监督学习与无监督学习：不仅把训练数据丢给计算机，而且还把分类的结果（数据具有的标签）也一并丢给计算机分析。
由于计算机在学习的过程中不仅有训练数据，而且有训练结果（标签），因此训练的效果通常不错。训练结束之后进行测试；

只给计算机训练数据，不给结果（标签），因此计算机无法准确地知道哪些数据具有哪些标签，只能凭借强大的计算能力分析数据的特征，从而得到一定的成果，通常是得到一些集合，集合内的数据在某些特征上相同或相似。

简述分类与聚类的联系与区别：分类是一种有监督的算法，是在已经有目标分类的情况下对数据进行类别判断（朴素贝叶斯算法）。而聚类是一种无监督算法，是在建立模型之前还没有目标分类，将特征相似的数据自动聚为一类的算法（KMeans聚类算法）。

二.

利用关于心脏情患者的临床数据集，建立朴素贝叶斯分类模型。

有六个分类变量(分类因子)：性别，年龄、KILLP评分、饮酒、吸烟、住院天数

目标分类变量疾病：–心梗–不稳定性心绞痛

新的实例：–(性别=‘男’，年龄<70, KILLP=‘I'，饮酒=‘是’，吸烟≈‘是”，住院天数<7)

最可能是哪个疾病？

三.

编程实现朴素贝叶斯分类算法

利用训练数据集，建立分类模型。

输入待分类项，输出分类结果。

可以心脏情患者的临床数据为例，但要对数据预处理。

from sklearn.datasets import load_iris
iris=load_iris()
from sklearn.naive_bayes import GaussianNB
gnb=GaussianNB() #模型
gnb.fit(iris.data,iris.target) #训练
gnb.predict([[4.8, 3.5 , 4.2, 1.2]]) #分类

posted @ 2018-11-19 11:05 陈松林阅读(463) 评论(0) 收藏举报

刷新页面返回顶部

分类与监督学习，朴素贝叶斯分类算法

公告