04 2020 档案
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 第一题: 特征选择:从所有特征中选取有用的特征。 PCA:通过降维,建立新特征取代部分冗余的旧特征。 第二题: 特征选择 PCA 不会改变特征值 会改变特征值 不会减少数据集的维数 可以减少数据集的维
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 第一题: ①增加样本量。②对稀疏的数据进行正则化处理。③特征选择。④特征离散化。 过拟合时,拟合函数的系数往往非常大,需要顾忌每一个点,最终形成的拟合函数波动很
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 1.逻辑回归:逻辑回归是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。 线性回归 逻辑回归 要求变量服从正态分布 对变量分布没有要求 要
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 第一题 ①机器学习分类 ②了解回归算法 ③回归和分类的区别 ④线性回归模型 ⑤损失函数 ⑥
阅读全文
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 2. 观察学习与生活中可以
阅读全文
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5
阅读全文
摘要:用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”。 梯度 一个向量,表示某一函数在该点处的方向导数沿该方向取得最大值,即函数在该点处沿着该方向变化最快且变化率最大。 梯度下降 一种迭代法,可用于求解最小二乘问题。(让梯度中所有偏导函数都下降到最低点的过程) 贝叶斯定理 关于随机事件A和B的条件概
阅读全文
摘要:开发环境及Python版本 pip list 机器学习定义 机器学习模型算法 1.逻辑回归 2.EM算法 3.集成学习 4.随机森林和GBDT 5.ID3/C4.5 6.K-means 7.K近邻 8.xgboost/lightGBM Pip部分命令 pip install 包名 下载包 pip u
阅读全文
浙公网安备 33010602011771号