摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是结果; 深度学习、机器学习是方法,是工具; 机器学习,一种实现人工智能的方法; 机器学习都可以被精准地定义为:1.任务T;2.训练过程;3.模型表现P 深度学习则是一种实现机器学习的技术;它适合处理大数据。 深度学习使得机器学习能够实 阅读全文
posted @ 2020-06-01 10:40 Fzwei博客 阅读(181) 评论(0) 推荐(0)
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-25 21:00 Fzwei博客 阅读(205) 评论(0) 推荐(0)
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 名子分词 去掉过短的单词 词性还原 连接成字符串 传统方法来实现 nltk库的安装与使用 pip install nltk import nltk nltk.download() # sever地址改成 h 阅读全文
posted @ 2020-05-20 19:55 Fzwei博客 阅读(161) 评论(0) 推荐(0)
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:都是对数据进行分类 区别:分类是已知类别,聚类是不知类别;分类对已知分类的数据进行训练和学习,聚类不需要对数据进行训练和学习 简述什么是监督学习与无监督学习。 监督学习:从给定的训练数据集中学习出一个函数(模型参数),当 阅读全文
posted @ 2020-05-12 19:31 Fzwei博客 阅读(147) 评论(0) 推荐(0)
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 特征选择就是从数据的所有特征中选择部分的特征作为训练集,从而降低数据维度,提高机器学习性能。 2、PCA 主成分分析是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。 二、并用自己的话阐述出两者 阅读全文
posted @ 2020-04-28 17:32 Fzwei博客 阅读(138) 评论(0) 推荐(0)
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 源代码: from sklearn. 阅读全文
posted @ 2020-04-28 17:18 Fzwei博客 阅读(114) 评论(0) 推荐(0)
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合: L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。 加大样本量。 通过特征选择减少特征量。 阅读全文
posted @ 2020-04-28 10:54 Fzwei博客 阅读(159) 评论(0) 推荐(0)
摘要: 一、本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 1、什么是回归算法 回归算法是监督型算法的一种,通过利用测试集数据来建立模型,再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线,这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。 2、回归 阅读全文
posted @ 2020-04-22 21:52 Fzwei博客 阅读(312) 评论(0) 推荐(0)
摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 原图: 压缩图: 源代码: 阅读全文
posted @ 2020-04-19 15:32 Fzwei博客 阅读(157) 评论(0) 推荐(0)
摘要: 本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶 阅读全文
posted @ 2020-04-14 16:36 Fzwei博客 阅读(140) 评论(0) 推荐(0)