04 2020 档案

摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1. 增加样本量,这是万能的方法,适用任何模型。 2. 如果数据稀疏,使用L1正则,其他情况,用L2要好,可自己尝试。 3. 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 4. 如果还过拟合,那就看看是 阅读全文
posted @ 2020-04-29 14:41 椰梨 阅读(158) 评论(0) 推荐(0)
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 有许多不同的方法可用于特征选择。其中最重要的是: 1.过滤方法=过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。 2.遵循过滤方法的相同目标,但使用机器学习模型作为其评估标准(例如,向前/向后/双向/递归特 阅读全文
posted @ 2020-04-28 18:22 椰梨 阅读(518) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre 阅读全文
posted @ 2020-04-27 14:50 椰梨 阅读(142) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是机器学习中的一种分类模型,在线性回归的基础上,套用了一个逻辑函数,用于估计某种事物的可能性。 他们的区别是: 1 线性回归是计算出具体的值,是解决回归问题;逻辑回归是给出是和否,解决的是分类问题。 2 逻辑回归引入了si 阅读全文
posted @ 2020-04-25 10:39 椰梨 阅读(239) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要。 答:机器学习监督学习算法分为分类算法和回归算法两种,其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测,针对的是数值型的样本,使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升 阅读全文
posted @ 2020-04-22 13:53 椰梨 阅读(188) 评论(0) 推荐(0)
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn. 阅读全文
posted @ 2020-04-19 18:33 椰梨 阅读(98) 评论(0) 推荐(0)
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5).想想k均值算法中以用来做什么? 文本分析和归类K均值算法实现图像压缩像素处理K均值算法处理图 阅读全文
posted @ 2020-04-15 22:25 椰梨 阅读(105) 评论(0) 推荐(0)
摘要:1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”,可以word编辑,可做思维导图,可以手写拍照,要求言简意赅、排版整洁。 梯度: 在向量微积分中,标量场的梯度是一个向量场。标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这 阅读全文
posted @ 2020-04-15 13:34 椰梨 阅读(107) 评论(0) 推荐(0)
摘要:1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。 2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 3)什么是机器学习,有哪些分类?结合案例,写出你的理解。 答:机器学习(Machine Learning,ML)是人工智能的核心,涉 阅读全文
posted @ 2020-04-03 14:00 椰梨 阅读(240) 评论(0) 推荐(0)