2020年6月8日
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-08 22:09 是诗诗吖 阅读(241) 评论(0) 推荐(0) 编辑
  2020年6月1日
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答:人工智能指的是计算机的输出。计算机正在做一些智能的事情,所以它展示的是人工智能。 机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数 阅读全文
posted @ 2020-06-01 17:14 是诗诗吖 阅读(73) 评论(0) 推荐(0) 编辑
  2020年5月24日
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-24 20:39 是诗诗吖 阅读(121) 评论(0) 推荐(0) 编辑
  2020年5月18日
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-18 14:06 是诗诗吖 阅读(143) 评论(0) 推荐(0) 编辑
  2020年5月9日
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 答: 分类是事先定义好类别 ,类别数不变 ,属于有监督学习; 聚类则没有事先预定的类别,类别数不确定,属于非监督学习。 简述什么是监督学习与无监督学习。 答:监督学习(supervised learning):通过已有的训练样 阅读全文
posted @ 2020-05-09 20:49 是诗诗吖 阅读(229) 评论(0) 推荐(0) 编辑
  2020年4月27日
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 答:特征选择:选择部分特征当做机器学习的相关数据。 PCA:PCA是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原数据的维数(复杂度),损失少量信息,可以消减回归分析或聚类分析中特征的数量。 二、并用自己的话阐述出两者的 阅读全文
posted @ 2020-04-27 18:14 是诗诗吖 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 threshold =1.0 threshold =2.0 阅读全文
posted @ 2020-04-27 09:47 是诗诗吖 阅读(122) 评论(0) 推荐(0) 编辑
  2020年4月26日
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答:逻辑回归是用正则化防止过拟合的;过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 2.用logiftic回归来进行实践操作,数据不限。 阅读全文
posted @ 2020-04-26 20:01 是诗诗吖 阅读(142) 评论(0) 推荐(0) 编辑
  2020年4月24日
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法。 区别线性回归假设响应变量服从正态分布,逻辑回归假设响应变量服 阅读全文
posted @ 2020-04-24 21:04 是诗诗吖 阅读(158) 评论(0) 推荐(0) 编辑
  2020年4月20日
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归是基于已有数据对新的数据进行预测,比如预测股票走势。这里我们主要讲简单线性回归。基于标准的线性回归,可以扩展出更多的线性回归算法。 线性回归就是能够用一个直线较为精确地描述数据之间的关系,这样当出现新的数据的时候,就能 阅读全文
posted @ 2020-04-20 21:39 是诗诗吖 阅读(337) 评论(0) 推荐(0) 编辑