2020年6月9日
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-09 08:56 LipengC 阅读(105) 评论(0) 推荐(0) 编辑
  2020年6月2日
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 机器学习:一种实现人工智能的方法 机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。 阅读全文
posted @ 2020-06-02 10:50 LipengC 阅读(136) 评论(0) 推荐(0) 编辑
  2020年5月25日
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-25 18:43 LipengC 阅读(143) 评论(0) 推荐(0) 编辑
  2020年5月20日
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-20 13:17 LipengC 阅读(130) 评论(0) 推荐(0) 编辑
  2020年5月13日
摘要: 老师:MissDu 提交作业 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答:监督学习:根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。 无监督学习:我们不知道数据集中数据、特征之间的关系, 阅读全文
posted @ 2020-05-13 20:24 LipengC 阅读(164) 评论(0) 推荐(0) 编辑
  2020年5月1日
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
posted @ 2020-05-01 18:03 LipengC 阅读(110) 评论(0) 推荐(0) 编辑
  2020年4月27日
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得 阅读全文
posted @ 2020-04-27 21:09 LipengC 阅读(524) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? 答:逻辑回归通过以下几点防止过拟合 1、增加样本数量 2、正则化:当数据稀疏时,使用L1正则化比L2效果要好 3、特征筛选:剔除不必要的特征 4、检查业务逻辑,判断特征的有效性 在过拟合时,拟合函数的系数往往非常大,需要顾忌每一个点,最终 阅读全文
posted @ 2020-04-27 21:05 LipengC 阅读(128) 评论(0) 推荐(0) 编辑
  2020年4月23日
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 一、性质不同 (1)逻辑回归:是一种广义的线性回归分析模型。 (2)线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。复 二、应用不同 (1)逻辑回归:常用于数据挖掘,疾病自动诊断, 阅读全文
posted @ 2020-04-23 21:52 LipengC 阅读(167) 评论(0) 推荐(0) 编辑
  2020年4月21日
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)线性回归的定义和多元一次线性方程 定义:线性回归通过一个或者多个自变量与因变量之间进行建模的回归方法,其中可以为一个或者多个自变量之间的线性组合; (2)线性回归的机器预测跟真实值是存在一定的误差的 (3)损失函数( 阅读全文
posted @ 2020-04-21 20:47 LipengC 阅读(148) 评论(0) 推荐(0) 编辑