会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Fzwei博客
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2020年6月1日
14 深度学习-卷积
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是结果; 深度学习、机器学习是方法,是工具; 机器学习,一种实现人工智能的方法; 机器学习都可以被精准地定义为:1.任务T;2.训练过程;3.模型表现P 深度学习则是一种实现机器学习的技术;它适合处理大数据。 深度学习使得机器学习能够实
阅读全文
posted @ 2020-06-01 10:40 Fzwei博客
阅读(181)
评论(0)
推荐(0)
2020年5月25日
13-垃圾邮件分类2
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target,
阅读全文
posted @ 2020-05-25 21:00 Fzwei博客
阅读(205)
评论(0)
推荐(0)
2020年5月20日
12.朴素贝叶斯-垃圾邮件分类
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h
阅读全文
posted @ 2020-05-20 19:55 Fzwei博客
阅读(161)
评论(0)
推荐(0)
2020年5月12日
11.分类与监督学习,朴素贝叶斯分类算法
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:都是对数据进行分类 区别:分类是已知类别,聚类是不知类别;分类对已知分类的数据进行训练和学习,聚类不需要对数据进行训练和学习 简述什么是监督学习与无监督学习。 监督学习:从给定的训练数据集中学习出一个函数(模型参数),当
阅读全文
posted @ 2020-05-12 19:31 Fzwei博客
阅读(147)
评论(0)
推荐(0)
2020年4月28日
9、主成分分析
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从数据的所有特征中选择部分的特征作为训练集,从而降低数据维度,提高机器学习性能。 2、PCA 主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。 二、并用自己的话阐述出两者
阅读全文
posted @ 2020-04-28 17:32 Fzwei博客
阅读(138)
评论(0)
推荐(0)
8、特征选择
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 源代码: from sklearn.
阅读全文
posted @ 2020-04-28 17:18 Fzwei博客
阅读(114)
评论(0)
推荐(0)
7.逻辑回归实践
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合: L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。 加大样本量。 通过特征选择减少特征量。
阅读全文
posted @ 2020-04-28 10:54 Fzwei博客
阅读(159)
评论(0)
推荐(0)
2020年4月22日
5.线性回归算法
摘要: 一、本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1、什么是回归算法 回归算法是监督型算法的一种,通过利用测试集数据来建立模型,再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线,这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。 2、回归
阅读全文
posted @ 2020-04-22 21:52 Fzwei博客
阅读(312)
评论(0)
推荐(0)
2020年4月19日
4.K均值算法--应用
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 原图: 压缩图: 源代码:
阅读全文
posted @ 2020-04-19 15:32 Fzwei博客
阅读(157)
评论(0)
推荐(0)
2020年4月14日
2.机器学习相关数学基础
摘要: 本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶
阅读全文
posted @ 2020-04-14 16:36 Fzwei博客
阅读(140)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告