04 2020 档案

摘要:一、用自己的话描述出其本身的含义: 1、特征选择 从原来的多组特征里面进行筛选,选择出一些特征来降低特征量。通过特征选择来过滤掉一些冗杂的特征以达到降低数据集维度的目的。 2、PCA(主成分分析) 是一种分析和简化数据集的技术,主要目的是为了将数据维护压缩,尽可能的降低原本数据的复杂。程度,不过会因 阅读全文
posted @ 2020-04-30 16:23 HvYan 阅读(176) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
posted @ 2020-04-28 14:57 HvYan 阅读(134) 评论(0) 推荐(0)
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 算法层面: ①L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 ②L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。 数据层面: ①增加样本数量 ②通过特 阅读全文
posted @ 2020-04-28 14:38 HvYan 阅读(186) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归虽然名字里带“回归”两字,但实际上是这却是一种分类方法,用于解决一些二分类问题(即输出的结果只有两种)的机器学习方法。人们将它用于估计某种事物的可能性,比如某个人患病的可能性、某商品被某用户购买的可能性等等。 逻辑回归是一 阅读全文
posted @ 2020-04-24 21:41 HvYan 阅读(291) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性。 (1)监督学习的分类:回归算法与分类算法 回归算法的简介: 回归算法与分类算法的区别: (2)回归算法的具体应用:房价预测、销售额预测、 (3)回归算法的定义: (4)预测值与真实值存在一定误差: (5)误差计算方法与优 阅读全文
posted @ 2020-04-21 17:49 HvYan 阅读(185) 评论(0) 推荐(0)
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 代码: #20170612 阅读全文
posted @ 2020-04-16 18:29 HvYan 阅读(274) 评论(0) 推荐(0)
摘要:1) 扑克牌手动演练k均值聚类过程:>30张牌,3类 3) 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 代码: #201706120153-许卉欣 from sklearn.datasets import load_iris from sklearn. 阅读全文
posted @ 2020-04-13 20:32 HvYan 阅读(303) 评论(0) 推荐(0)
摘要:【学习笔记】 1)概率论与贝叶斯先验 本福特定律:又称第一数字定律,是指在实际生活得出的一组数据中,以1为首出现的概率约为总数的三成;是直观现象1/9的三倍。 贝叶斯公式:给定某系统的若干样本X,计算该系统的参数。-28:13 分布-32:56 两点分布 0-1分布 -33:02 二项分布 -34: 阅读全文
posted @ 2020-04-12 15:59 HvYan 阅读(143) 评论(0) 推荐(0)
摘要:1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。 2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 p1 机器学习概论 机器学习定义:给予某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提 阅读全文
posted @ 2020-04-03 14:33 HvYan 阅读(258) 评论(0) 推荐(0)