2020年6月9日

15 手写数字识别-小数据集

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x: 阅读全文

posted @ 2020-06-09 10:31 He11o 阅读(236) 评论(0) 推荐(0)

2020年6月1日

14 深度学习-卷积

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 ①人工智能 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括语音识别、图像识别、机器人、自然语言处理、智能搜索和专家系统等。人工智能可以对人的意识、思维的信息过程的 阅读全文

posted @ 2020-06-01 10:25 He11o 阅读(164) 评论(0) 推荐(1)

2020年5月24日

13-垃圾邮件分类2

摘要: 1.读取 代码: #1.读取数据 import csv sms = open("venv/data/SMSSpamCollection","r",encoding="utf-8") #读取数据集 sms_data = [] #提取邮件内容 sms_label = [] #提取邮件标签 csv_rea 阅读全文

posted @ 2020-05-24 20:49 He11o 阅读(186) 评论(0) 推荐(0)

2020年5月18日

12.朴素贝叶斯-垃圾邮件分类

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文

posted @ 2020-05-18 11:42 He11o 阅读(138) 评论(0) 推荐(0)

2020年5月11日

11.分类与监督学习,朴素贝叶斯分类算法

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类的目的是 为了确定一个点的类别,具体有哪些类别是已知的,而聚类的目的是将一系列的点分成若干类,事先是没有类别的。 他们的联系:两者都是要从数据集中寻找到离目标点最近的点(数据)。 监督学习 阅读全文

posted @ 2020-05-11 00:10 He11o 阅读(209) 评论(0) 推荐(0)

2020年4月27日

9、主成分分析

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 含义:从给定的特征集合中选择出相关特征子集的过程,称为特征选择。也可以说,选择出一些最有效特征以降低数据集维度的过程 2、PCA 含义:它是一种简化数据集的技术。也是一个线性变化。可想象成它将原来的样本数据投影到一个新的空间中,把一组坐标转换到另外一 阅读全文

posted @ 2020-04-27 18:10 He11o 阅读(150) 评论(0) 推荐(0)

8、特征选择

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 代码: from sklearn.feature_selection import Variance 阅读全文

posted @ 2020-04-27 09:31 He11o 阅读(106) 评论(0) 推荐(0)

2020年4月26日

7.逻辑回归实践

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) ①逻辑回归是利用正则化来防止过拟合的; ②因为正则化参数设置得足够大,权重矩阵被设置为接近于0的值,那么一些影响不大的因素就可以降低到0,则忽略不计,因此就可以让模型复杂度降低,从而防止过拟合。 2.用logift 阅读全文

posted @ 2020-04-26 18:12 He11o 阅读(168) 评论(0) 推荐(0)

2020年4月25日

6.逻辑归回

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? ①逻辑回归是用回归的方法来分类和通过把一系列数据点预测计算出一条合适的“线”,将新的数据点映射到这条预测的“线”上,继而做出预测。 ②逻辑回归预测的是”S“线,参数计算使用梯度下降方法。;线性回归预测的是直线,参数计算使用最小二乘 阅读全文

posted @ 2020-04-25 18:47 He11o 阅读(131) 评论(0) 推荐(0)

2020年4月20日

5.线性回归算法

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 一.回归算法属于监督学习,线性回归就属于其中一个知识点。 二.线性回归就是多个自变量和因变量组合形成的线性关系。 三.统计学习中用到线性回归算法,它通过误差的评分合/最小二乘法。同时如果要将误差变最小,是再通过正规方程/梯 阅读全文

posted @ 2020-04-20 16:48 He11o 阅读(184) 评论(0) 推荐(0)

导航