04 2020 档案
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 特征选择也叫特征子集选择。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化, 是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段, 也是模式识别中关键的数据预处理步骤。 2、PCA
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 是通过正则化来防止的。 过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。如下图所示,过拟合,就是拟合函数需要顾忌每一个点,最终形成的拟合函数波动
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归:通过一组预测器变量,可以很有效的预测特征与输出结果。 这与线性回归很相似,但更适用于二分类问题。 方程系数可以用来估计模型中的自变量的比率,这适用于更广泛的问题模型,另一方面,可以将逻辑回归用于确定某个事件的可能性,输出
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)有监督:训练数据集必须是有标记,然后通过给定的训练数据和特定的算法去构造一个模型。 无监督:训练数据集没有标记,去寻找训练数据中隐藏的模式或者是对数据进行分组。 (2)线性回归原理: 线性回归在假设特证满足线性关系,
阅读全文
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 在这里的时候就一直处于运行
阅读全文
摘要:2.自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示 3 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4 鸢尾花完整数据做聚类并用散点图显示. 5 想想k均值算法中以用来做什么? K-均值算法(K-Mean)是指中心的距离的平方
阅读全文
摘要:1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 极值点:是在一阶导数等于0的点,2阶导大于0是极小值,2阶导小于0是极大值.2阶导等于0是拐点,不是极值点. 最值:在定义域内的最大最小值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘
阅读全文
摘要:(1) (2) (3) 按照学习形式将机器学习划分为监督学习、无监督学习、半监督学习、强化学习、深度学习 监督学习(Supervised Learning)表示机器学习的数据是带标记的,这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果,不断修正机器的预测结果。 无监督学习(Un
阅读全文

浙公网安备 33010602011771号