04 2020 档案
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征拿好的特征,差的特征就不要,特征在选择前后 可以改变特征部分的值、也可以不改变特征部分的值,只是选择后的特征维数肯定要比选择前小。 PCA PCA是一种分析、简化数据集
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归通过正则化来防止过拟合;正则化可以防止过拟合是因为过拟合的时候,拟合函数的系数往往非常大,而正则化是 通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况,以L2正则化为例,正则项会使权重趋于
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? Logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlinear model)。 这一家族
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 一、算法简介 1.1 什么是回归分析 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。通常使用曲线/线来拟合数据点,目
阅读全文
摘要:1. 应用K-means算法进行图片压缩。 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn
阅读全文
摘要:扑克牌手动演练k均值聚类过程:>30张牌,3类 在其中选择了3张牌作为初始中心,即点数为1、2、3的牌放在上面作为中心 第1轮:聚类中心为1、2、3,新聚类中心为1、2、6 第2轮:聚类中心为1、2、6,新聚类中心为1、3,6 第3轮:聚类中心为1、3、6,新聚类中心为1、3、6 用sklearn.
阅读全文
摘要:高数笔记 导数就是曲线的斜率,是曲线变化快慢的反应 二阶导数是斜率变化快慢的反应,表征曲线凹凸性 二阶导数连续的曲线,往往称之为“光顺的” 常用函数的导数 泰勒公式 函数展开成无穷级数 方向导数 梯度 割线位于函数的上方 概率论 线性代数
阅读全文
摘要:Python环境 学习笔记 机器学习是在于给定一个任务,然后在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验;不断地提供合适、优值、大量的经验,该程序对于任务的性能逐步提高。 机器学习的一般流程是先要收集数据,然后进行数据清洗,建立工程,再数据建模 机器学习可分为有监督学习、无监
阅读全文

浙公网安备 33010602011771号