04 2020 档案
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 增加样本量;使用正则方式;通过特征选择,剔除一些不重要的特征,从而降低模型复杂度; 检查业务逻辑,判断特征有效性,是否在用结果预测结果;进行离散化处理,所有特征都离散化。 过拟合的时候,拟合函数的系数往往非常大,而
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型。 它们的区别: 1 >线性回归是计算出具体的值,是解决回归问题;逻辑回归
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归是统计学中最有力的工具之一,机器学习监督学习算法分为分类算法、回归算法两种。分布类型为离散型,连续型。回归算法用于连续型分布,针对数值型的样本; 分类和回归的区别在于输出变量的类型:定量输出称为回归,或者说是连续变量的
阅读全文
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 原图: 压缩后: 源代码:
阅读全文
摘要:1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip
阅读全文
摘要:本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶
阅读全文
摘要:1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编
阅读全文
浙公网安备 33010602011771号