[︵︵] - 博客园

2020年6月1日

摘要： 1.简述人工智能、机器学习和深度学习三者的联系与区别。 ●人工智能是目的，是结果；深度学习、机器学习是方法，是工具； ●机器学习，一种实现人工智能的方法；机器学习都可以被精准地定义为： 1.任务T 2.训练过程E 3.模型表现P ●深度学习则是一种实现机器学习的技术；它适合处理大数据。 1.深度学阅读全文

posted @ 2020-06-01 10:48 [︵︵] 阅读(136) 评论(0) 推荐(0)

2020年5月22日

13-垃圾邮件分类2

摘要： 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train，x_test， y_train， y_test = train_test_split(data， target，阅读全文

posted @ 2020-05-22 20:37 [︵︵] 阅读(173) 评论(0) 推荐(0)

2020年5月16日

12.朴素贝叶斯-垃圾邮件分类

摘要： 1. 读邮件数据集文件，提取邮件本身与标签。列表 numpy数组 2.邮件预处理邮件分句名子分词去掉过短的单词词性还原连接成字符串传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文

posted @ 2020-05-16 14:02 [︵︵] 阅读(122) 评论(0) 推荐(0)

2020年5月7日

11.分类与监督学习，朴素贝叶斯分类算法

摘要： 1.理解分类与监督学习、聚类与无监督学习。（1）简述分类与聚类的联系与区别。分类技术是一种有指导的学习，即每个训练样本的数据对象已经有类标识，对数据进行判断。聚类是一种无指导学习。也就是说，聚类是在预先不知道欲划分类的情况下，根据信息相似度原则进行信息聚类的一种方法。区别：分类是事先定义好类阅读全文

posted @ 2020-05-07 14:29 [︵︵] 阅读(231) 评论(0) 推荐(0)

2020年4月27日

9、主成分分析

摘要：一、用自己的话描述出其本身的含义： ①特征选择当数据预处理完成后，我们需要选择有意义的特征输入机器学习的算法和模型进行训练，例如从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化，是从原始特征中选择出一些最有效特征以降低数据集维度的过程。 ②PCA 对于一组不同维度之间可能存阅读全文

posted @ 2020-04-27 20:16 [︵︵] 阅读(162) 评论(0) 推荐(0)

8、特征选择

摘要：用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图放上来（没有条件的备注说明原因）注意：每个人的电脑ID是不一样的 1.Variance Thresho 阅读全文

posted @ 2020-04-27 10:48 [︵︵] 阅读(111) 评论(0) 推荐(0)

2020年4月26日

7.逻辑回归实践

摘要： 1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？（大家用自己的话介绍下）（1）逻辑回归是怎么防止过拟合的？逻辑回归通过离散化处理，所有特征都离散化以防止过拟合。有下列2种方法： ①减少feature个数（人工定义留多少个feature、算法选取这些feature） ②规格化（留下所有阅读全文

posted @ 2020-04-26 17:37 [︵︵] 阅读(169) 评论(0) 推荐(0)

2020年4月23日

6.逻辑回归

摘要： 1.用自己的话描述一下，什么是逻辑回归，与线性回归对比，有什么不同？（1）性质不同 ①逻辑回归：是一种广义的线性回归分析模型。 ②线性回归：利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。（2）应用不同 ①逻辑回归：常用于数据挖掘，疾病自动诊断，经济预测等阅读全文

posted @ 2020-04-23 11:01 [︵︵] 阅读(155) 评论(0) 推荐(0)

2020年4月20日

5.线性回归算法

摘要： 1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性本节课学习了机器学习中的监督学习里的线性回归算法，回归是统计学中最有力的工具之一。机器学习监督学习算法分为分类算法和回归算法两种，其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测，针对的是数阅读全文

posted @ 2020-04-20 20:51 [︵︵] 阅读(396) 评论(0) 推荐(0)

2020年4月18日

4.K均值算法--应用

摘要： 1. 应用K-means算法进行图片压缩读取一张图片观察图片文件大小，占内存大小，图片数据结构，线性化用kmeans对图片像素颜色进行聚类获取每个像素的颜色类别，每个类别的颜色压缩图片生成：以聚类中收替代原像素颜色，还原为二维观察压缩图片的文件大小，占内存大小 from sklearn. 阅读全文

posted @ 2020-04-18 19:58 [︵︵] 阅读(137) 评论(0) 推荐(0)