摘要: 一、选题与意义 2.kaggle分析数据项目 关于虚拟机的知识忘了挺多,而这个学期也是学了些python,而kaggle里边的基本都是python知识。 二、实践方案 对数据进行模型预测和训练,划分测试集和训练集 三、实践任务分解 划分数据集,确定模型,训练模型,模型预测。 四、实践计划 按任务分解 阅读全文
posted @ 2020-06-23 21:20 Chaiyeh 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-12 11:37 Chaiyeh 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,也是当今人工智能大爆炸的核心驱动。 2. 全连接神经网络与卷积神经网络的联系与区别。 卷积神经网络也是通过一层一层的节点组织起来的。和全连接神经网络一 阅读全文
posted @ 2020-06-06 00:54 Chaiyeh 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-22 12:27 Chaiyeh 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path = r".\SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') csv_reader = csv.reader(s 阅读全文
posted @ 2020-05-15 10:13 Chaiyeh 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类是按照标签进行分类 聚类是将相似的放在一起 简述什么是监督学习与无监督学习。 监督学习:从标记的训练数据来判断一个功能,从正确的例子进行学习。 无监督学习:没有足够的先验知识,需要机器自己学习。 2.朴素贝叶斯分类算法 实 阅读全文
posted @ 2020-05-09 19:12 Chaiyeh 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 从事物的特征中选择出一些最有效特征来降低数据集维度。 2、PCA 在减少信息损失的情况下进行降低数据维度。 二、并用自己的话阐述出两者的主要区别 特征选择后的特征还是原来特征的子集; PCA改变了特征形式,特征抽取后的新特征是原来特征的一个映射。 阅读全文
posted @ 2020-05-01 21:29 Chaiyeh 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文
posted @ 2020-04-29 21:00 Chaiyeh 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 增加样本量;使用正则方式;通过特征选择,剔除一些不重要的特征,从而降低模型复杂度; 检查业务逻辑,判断特征有效性,是否在用结果预测结果;进行离散化处理,所有特征都离散化。 过拟合的时候,拟合函数的系数往往非常大,而 阅读全文
posted @ 2020-04-29 20:47 Chaiyeh 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型。 它们的区别: 1 >线性回归是计算出具体的值,是解决回归问题;逻辑回归 阅读全文
posted @ 2020-04-24 08:49 Chaiyeh 阅读(113) 评论(0) 推荐(0) 编辑