04 2020 档案

9、主成分分析
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 通过样本的特征来预测样本所对应的值。这个样本数量一定要多,利用已有的特征计算出一个抽象程度更高的特征集。 2、PCA 主成分分析技术,利用降维的思想,把多指标转化为少数几个综合指标。 二、并用自己的话阐述出两者的主要区别 特征选择是从已经存在的特征中 阅读全文

posted @ 2020-04-29 15:14 dyunc3 阅读(188) 评论(0) 推荐(0)

8、特征选择
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来 阅读全文

posted @ 2020-04-29 15:02 dyunc3 阅读(119) 评论(0) 推荐(0)

7.逻辑回归实践
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 增加样本量 如果数据稀疏,使用L1正则,其他则L2 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。 检查业务逻辑,判断特征有效性,是否在用结果预测结果 进行离散化处理,所有特征都离散化 2.用logift 阅读全文

posted @ 2020-04-29 14:56 dyunc3 阅读(141) 评论(0) 推荐(0)

6.逻辑归回
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 它常用于数据挖掘,是一种广义的线性回归分析模型,用来解决二分类机器学习 0 or 1 的问题。而线性回归利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。它常用于数学计算方法。 2.自述一下什 阅读全文

posted @ 2020-04-26 10:33 dyunc3 阅读(106) 评论(0) 推荐(0)

5.线性回归算法
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 监督学习:监督学习是从标记的训练数据来推断一个功能的机器学习任务。 半监督学习:半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。 无监督学习:根据类别未知(没有被标记)的训练样本解决模式识别中的各 阅读全文

posted @ 2020-04-22 20:25 dyunc3 阅读(215) 评论(0) 推荐(0)

4.K均值算法--应用
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 import matplotlib.pyplot as pillow #导入所需要的包 mortyimage=pillow.imread("./morty.png") #导入自备的图片Morty!!!!! pillow.imshow(morty 阅读全文

posted @ 2020-04-19 17:02 dyunc3 阅读(158) 评论(0) 推荐(0)

3.K均值算法
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5 阅读全文

posted @ 2020-04-16 15:50 dyunc3 阅读(118) 评论(0) 推荐(0)

2.机器学习相关数学基础
摘要:1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 2)总结“梯度”,“梯度下降”和“贝叶斯定理” 课堂笔记: 梯度:某一函数在该点处的方向导数沿着该方向变化最快,变化率最大。 梯度下降:在梯度下降的方向求解最小值 贝叶斯定理:关于随机事件A和B的条件概率,如P(A|B)是在B发生的情况下A发 阅读全文

posted @ 2020-04-13 13:44 dyunc3 阅读(135) 评论(0) 推荐(0)

1. 机器学习概述
摘要:1)Python环境及pip list。 Python环境 pip list 2)https://www.bilibili.com/video/BV1Tb411H7uC?p=1视频学习笔记 3)什么是机器学习,有哪些分类? 对于某个给定的任务A,在合理的性能度量方案P的前提下,某计算机程序可以自主学 阅读全文

posted @ 2020-04-01 16:42 dyunc3 阅读(121) 评论(0) 推荐(0)

导航