摘要: 作业十二 朴素贝叶斯垃圾邮件(实习忙忘了) 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 代码: import numpy as npimport csvp =r"SMSSpamCollection"sms= open(p,'r',encoding='utf-8')data=c 阅读全文
posted @ 2020-06-09 10:32 椰梨 阅读(301) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答:人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,也是当今人工智能大爆炸的核心驱动。 人工智能是目的,是结果;深度学习、机器学习是方法,是工具; 机器学习,一种实现人工智能的方法;机器学习都可以被 阅读全文
posted @ 2020-06-01 11:26 椰梨 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-26 12:12 椰梨 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 答:联系:聚类属于无监督学习,即模型训练过程中没有被目标标签监督。而分类属于监督学习,即其训练数据都标记了需要被预测的真实值。在很多情况下,聚类模型等价于分类模型的无监督形式。 区别:分类是事先定义好类别 ,类别数不变 。分类 阅读全文
posted @ 2020-05-10 20:05 椰梨 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1. 增加样本量,这是万能的方法,适用任何模型。 2. 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。 3. 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 4. 如果还过拟合,那就看看是 阅读全文
posted @ 2020-04-29 14:41 椰梨 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 有许多不同的方法可用于特征选择。其中最重要的是: 1.过滤方法=过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。 2.遵循过滤方法的相同目标,但使用机器学习模型作为其评估标准(例如,向前/向后/双向/递归特 阅读全文
posted @ 2020-04-28 18:22 椰梨 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre 阅读全文
posted @ 2020-04-27 14:50 椰梨 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是机器学习中的一种分类模型,在线性回归的基础上,套用了一个逻辑函数,用于估计某种事物的可能性。 他们的区别是: 1 线性回归是计算出具体的值,是解决回归问题;逻辑回归是给出是和否,解决的是分类问题。 2 逻辑回归引入了si 阅读全文
posted @ 2020-04-25 10:39 椰梨 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要。 答:机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升 阅读全文
posted @ 2020-04-22 13:53 椰梨 阅读(167) 评论(0) 推荐(0) 编辑
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn. 阅读全文
posted @ 2020-04-19 18:33 椰梨 阅读(94) 评论(0) 推荐(0) 编辑