摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x: 阅读全文
posted @ 2020-06-10 19:19 renshenbenzuig 阅读(324) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答: 人工智能是目的,是结果;机器学习、深度学习是方法,是工具。机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。 2. 全连接神经网络与卷积神经网络的联系与区别。 卷积神经网络也是通过一层一层的节点组织起来的。和全连接神经网 阅读全文
posted @ 2020-06-03 18:49 renshenbenzuig 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 1.读取 import csv path = r'C:\Users\Chen Zhenrui\PycharmProjects\untitled\机器学习\SMSSpamCollection' sms = open(path, 'r', encoding='utf-8') csv_reader = c 阅读全文
posted @ 2020-05-27 15:17 renshenbenzuig 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv path = r'C:\Users\Chen Zhenrui\PycharmProjects\untitled\机器学习\SMSSpamCollection' sms = open(path, 'r', enc 阅读全文
posted @ 2020-05-20 15:59 renshenbenzuig 阅读(187) 评论(1) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:分类与聚类都是在数据集中寻找离自己最近的点 区别:分类是一种有监督学习,目的是为了确定点的类别,而类别是已知的;聚类是一种无监督学习,目的是将点分为成若干个类,事先是没有类别的。 简述什么是监督学习与无监督学习。 监督学 阅读全文
posted @ 2020-05-12 16:08 renshenbenzuig 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献 阅读全文
posted @ 2020-05-02 14:31 renshenbenzuig 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)增加样本量(通用) (2)数据正则化 (3)通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 (4)如果还过拟合,那就看看是否使用了过度复杂的特征构造工程 (5)检查业务逻辑,判断特征有效性,是否在用 阅读全文
posted @ 2020-04-29 21:34 renshenbenzuig 阅读(129) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 代码: from sklearn.feature_selection import Variance 阅读全文
posted @ 2020-04-27 12:07 renshenbenzuig 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归本质上是一个线性回归模型,是一种用来解决二分类问题的机器学习方法,用于估计某种事物的可能性。 2.自述一下什么是过拟合和欠拟合? (1)过拟合:其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,太过贴 阅读全文
posted @ 2020-04-25 23:37 renshenbenzuig 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)思维导图 (2)回归算法 (3)梯度下降 (4)损失函数 2.思考线性回归算法可以用来做什么? 可以处理回归问题:例如房价预测,温度预测等 也可以处理分类问题:例如天气预测等 3.自主编写线性回归算法 ,数据可以自己 阅读全文
posted @ 2020-04-22 15:42 renshenbenzuig 阅读(196) 评论(0) 推荐(0) 编辑