2020年6月1日
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 ●人工智能是目的,是结果;深度学习、机器学习是方法,是工具; ●机器学习,一种实现人工智能的方法; 机器学习都可以被精准地定义为: 1.任务T 2.训练过程E 3.模型表现P ●深度学习则是一种实现机器学习的技术;它适合处理大数据。 1.深度学 阅读全文
posted @ 2020-06-01 10:48 [︵︵] 阅读(125) 评论(0) 推荐(0) 编辑
  2020年5月22日
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target,  阅读全文
posted @ 2020-05-22 20:37 [︵︵] 阅读(153) 评论(0) 推荐(0) 编辑
  2020年5月16日
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-16 14:02 [︵︵] 阅读(119) 评论(0) 推荐(0) 编辑
  2020年5月7日
摘要: 1.理解分类与监督学习、聚类与无监督学习。 (1)简述分类与聚类的联系与区别。 分类技术是一种有指导的学习,即每个训练样本的数据对象已经有类标识,对数据进行判断。 聚类是一种无指导学习。也就是说,聚类是在预先不知道欲划分类的情况下,根据信息相似度原则进行信息聚类的一种方法。 区别:分类是事先定义好类 阅读全文
posted @ 2020-05-07 14:29 [︵︵] 阅读(188) 评论(0) 推荐(0) 编辑
  2020年4月27日
摘要: 一、用自己的话描述出其本身的含义: ①特征选择 当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练,例如从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程。 ②PCA 对于一组不同维度之间可能存 阅读全文
posted @ 2020-04-27 20:16 [︵︵] 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 1.Variance Thresho 阅读全文
posted @ 2020-04-27 10:48 [︵︵] 阅读(108) 评论(0) 推荐(0) 编辑
  2020年4月26日
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) (1)逻辑回归是怎么防止过拟合的? 逻辑回归通过离散化处理,所有特征都离散化以防止过拟合。有下列2种方法: ①减少feature个数(人工定义留多少个feature、算法选取这些feature) ②规格化(留下所有 阅读全文
posted @ 2020-04-26 17:37 [︵︵] 阅读(149) 评论(0) 推荐(0) 编辑
  2020年4月23日
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? (1)性质不同 ①逻辑回归:是一种广义的线性回归分析模型。 ②线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 (2)应用不同 ①逻辑回归:常用于数据挖掘,疾病自动诊断,经济预测等 阅读全文
posted @ 2020-04-23 11:01 [︵︵] 阅读(136) 评论(0) 推荐(0) 编辑
  2020年4月20日
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 本节课学习了机器学习中的监督学习里的线性回归算法,回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数 阅读全文
posted @ 2020-04-20 20:51 [︵︵] 阅读(348) 评论(0) 推荐(0) 编辑
  2020年4月18日
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn. 阅读全文
posted @ 2020-04-18 19:58 [︵︵] 阅读(122) 评论(0) 推荐(0) 编辑