2020年6月9日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() #1.手写数字数据集 from sklearn.datasets import load_digits import numpy as np digit 阅读全文
posted @ 2020-06-09 09:42 Le、 阅读(243) 评论(0) 推荐(0) 编辑

2020年6月1日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能为机器赋予人的智能。机器学习是一种实现人工智能的方法,机器学习直接来源于早期的人工智能领域,传统算法包括决策树学习、推导逻辑规划、聚类、分类、回归、强化学习和贝叶斯网络等等。众所周知,我们还没有实现强人工智能。早期机器学习方法甚至都无法 阅读全文
posted @ 2020-06-01 16:54 Le、 阅读(136) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 12:14 Le、 阅读(264) 评论(0) 推荐(0) 编辑

2020年5月17日

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 #文件读取: #文件读取import csv sms = open("./sklearn朴素贝叶斯/data/SMSSpamCollection", 'r', encoding='utf-8') csv_reader = csv.r 阅读全文
posted @ 2020-05-17 23:21 Le、 阅读(232) 评论(0) 推荐(0) 编辑

2020年5月11日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 分类与聚类的联系:两者有一个共同点,它们都包含这样一个过程:对于想要分析的目标点,都会在数据集中寻找离它最近的点,即二者都用到了NN算法。 分类与聚类的区别:分类的目的是为了确定一个点的类别,具体有哪些类别是已知的。常用 阅读全文
posted @ 2020-05-11 15:45 Le、 阅读(201) 评论(0) 推荐(0) 编辑

2020年4月27日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:从m个原始特征中选择n个最有效特征以降低数据集维度的过程来使得系统的特定指标最优化。 2、PCA:数据中会使方差最大化的方向,它是在对特征数据执行投影或压缩时,最大化的降低信息丢失。 二、并用自己的话阐述出两者的主要区别 PCA降维是从选择最优基向量 阅读全文
posted @ 2020-04-27 19:25 Le、 阅读(108) 评论(0) 推荐(0) 编辑
 
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 #导入 from sklearn.f 阅读全文
posted @ 2020-04-27 12:05 Le、 阅读(130) 评论(0) 推荐(0) 编辑
 
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1)随着模型训练的进行,模型的复杂度会增加,此时模型在训练数据集上的训练误差会逐渐减小,但是在模型的复杂度达到一定程度时,模型在验证集上的误差反而随着模型的复杂度增加而增大。此时便发生了过拟合,即模型的复杂度升高, 阅读全文
posted @ 2020-04-27 11:44 Le、 阅读(199) 评论(0) 推荐(0) 编辑

2020年4月26日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归:logistic回归是一种广义线性回归,因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y 阅读全文
posted @ 2020-04-26 09:55 Le、 阅读(169) 评论(0) 推荐(0) 编辑

2020年4月21日

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1)这节课主要讲的是机器学习中的监督学习的回归算法。 2)回归算法用于连续分布预测,在给定输入的时候预测出一个数值。 3)监督学习中回归和分类的区别。回归是连续变量预测,分类是离散变量预测。 4)线性回归的定义、线性方程 阅读全文
posted @ 2020-04-21 11:56 Le、 阅读(166) 评论(0) 推荐(0) 编辑