主成分分析
摘要:一、用自己的话描述出其本身的含义: 1、特征选择:过滤掉与结果无关或者相关性很低的数据,达到降维的目的; 2、PCA:将原来的n维数据都映射到k维上,从这k维上抽取后的特征要能够精确地表示样本信息,使得信息丢失很小。 二、并用自己的话阐述出两者的主要区别特征选择后的特征是原来特征的一个子集;PCA选
阅读全文
posted @
2020-04-30 15:56
ccl666
阅读(147)
推荐(0)
特征选择
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样 from sklearn.featur
阅读全文
posted @
2020-04-27 15:53
ccl666
阅读(192)
推荐(0)
逻辑回归实践
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) ①:直接减少特征数、手动保留那些比较重要的特征; 但是有时候舍弃特征也舍弃了有用的信息。 ②:正则化:保留所有的特征,但是减小参数θθ的大小。 2.用logiftic回归来进行实践操作,数据不限。 #(1)加载lo
阅读全文
posted @
2020-04-27 14:13
ccl666
阅读(204)
推荐(0)
逻辑回归
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归和线性回归都是通过把一系列数据点预测计算出一条合适的“线”,将新的数据点映射到这条预测的“线”上,继而做出预测。 线性回归:主要用来做预测,过程是拟合函数,求参用的是最小二乘法。逻辑回归:主要用来做分类,过程是预测函数,求
阅读全文
posted @
2020-04-25 14:51
ccl666
阅读(130)
推荐(0)
线性回归算法
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 对于线性回归问题,我们的X和y是已知的,我们要解决的问题是,求取最合适的一个向量w,使得线性方程组能够尽可能的满足样本点的线性分布。之后我们就可以利用求得的w,对新的数据点进行预测。 其中真实值与预测值之间肯定是存在一些误
阅读全文
posted @
2020-04-21 15:32
ccl666
阅读(204)
推荐(0)
K均值算法--应用
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 import matplo
阅读全文
posted @
2020-04-19 19:09
ccl666
阅读(435)
推荐(0)
K均值算法
摘要:1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip
阅读全文
posted @
2020-04-16 16:36
ccl666
阅读(371)
推荐(0)
机器学习相关数学基础
摘要:2.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=2 1)P2 概率论与贝叶斯先验 2)P3 矩阵和线性代数 机器学习是一门多领域交叉学科,涉及较多的数学知识,本节课知识之前都有学过,这次根据重点重新梳理一遍,一定要多加重视。通过观看视
阅读全文
posted @
2020-04-14 17:44
ccl666
阅读(176)
推荐(0)
机器学习概述
摘要:1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编
阅读全文
posted @
2020-04-04 11:37
ccl666
阅读(158)
推荐(0)