8.特征选择
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: from sklearn.f
阅读全文
7.逻辑回归实践
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 上次的作业我们讲过什么是过拟合,过拟合就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳,机器学习时从样本学习了没用的特征。 过拟合(也叫做高方差) 在逻辑
阅读全文
6.逻辑回归
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 简单一点说,逻辑回归就是估计某样事物的可能性,比如疾病的诊断。 逻辑回归要求因变量必须是分类变量,二分类或者多分类的,而线性回归要求因变量必须是连续性数据变量。 2.自述一下什么是过拟合和欠拟合? 过拟合:就是所建的机器学习模型或
阅读全文
5.线性回归算法
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归是用一个直线描述数据之间的关系,然后再根据直线的趋势来进行预测,比如当我们知道x值的时候,就能够预测出他的y值。 2.思考线性回归算法可以用来做什么? 最近出了一款新游戏叫《集合啦!动物森友会》,游戏里面有一种农作
阅读全文
4.K均值算法--应用
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 首先来看一下完整代码: f
阅读全文
3.K均值算法
摘要:1)扑克牌手动演练k均值聚类过程:>30张牌,3类 一开始中心为:Q 8 4 : 重新分类后变成:Q 8 2 : 2)用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示 3)鸢尾花完整数据做聚类并用散点图显示 4)想想k均值算法中以用来做什么? 可以用于分析足球
阅读全文
2.机器学习相关数学基础
摘要:1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 本福特定律: 概率公式: 叶贝斯公式: 两点分布: 二项分布: 指数分布: 正态分布: beta分布: 方差: 中心极限定理: 线性代数: 代数余子式: 平稳分布: 矩阵向量乘法: 2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”,可
阅读全文
机器学习概述
摘要:1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。 因为之前课程用过,所以无需重新安装就可以直接运行 2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 3)什么是机器学习,有哪些分类?结合案例,写出你的理解。 机器学习是计算机针对某一
阅读全文