04 2020 档案

8、特征选择
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: from sklearn.f 阅读全文

posted @ 2020-04-28 18:59 chenjd 阅读(136) 评论(0) 推荐(0)

7.逻辑回归实践
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合: 算法:正则化; 数据:加大样本量;通过特征选择减少特征量 业务:EDA-探索有区分性的特征;特征派生-不断派生更多强组合的特征。 正则化防止过拟合:要拟合训练数据,就要足够大的模型空间;而用了足够大的 阅读全文

posted @ 2020-04-27 14:29 chenjd 阅读(215) 评论(0) 推荐(0)

6.逻辑回归
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是一种广义的线性回归分析模型,要求因变量必须是连续性数据变量。常用于数据挖掘,疾病自动诊断,经济预测等领域。 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互zd依赖的定量关系的一种统计分析方法,要求因变量 阅读全文

posted @ 2020-04-23 14:34 chenjd 阅读(159) 评论(0) 推荐(0)

5.线性回归算法
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归算法概述: 线性关系模型: 机器学习与真实值也是又一定误差的: 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 线性回归算法可以用来对数据进行统计并分析出一个走势。 例如可以根据数据来评估电影的票房,房价的 阅读全文

posted @ 2020-04-21 19:21 chenjd 阅读(210) 评论(0) 推荐(0)

4.K均值算法--应用
摘要:1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 代码: import nu 阅读全文

posted @ 2020-04-17 17:41 chenjd 阅读(255) 评论(0) 推荐(0)

3.K均值算法
摘要:1). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) from sklearn.datasets import load_irisimport numpy as npimport matplotlib.pyplot as plt#(1)首先使用Python实 阅读全文

posted @ 2020-04-14 17:32 chenjd 阅读(246) 评论(0) 推荐(0)

2.机器学习相关数学基础
摘要:1)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 2)用自己的话总结“梯度”,“梯度下降”和“贝叶斯定理”,可以word编辑,可做思维导图,可以手写拍照,要求言简意赅、排版整洁。 梯度:可以说这是一个向量,梯度的方向与取得最大方向导数的方向一致,模为方向导数的最大值。例如:我们要下山,如何最 阅读全文

posted @ 2020-04-11 19:12 chenjd 阅读(155) 评论(0) 推荐(0)

1. 机器学习概述
摘要:1、pip环境和基本库: 2、学习笔记 3、什么是机器学习,有哪些分类?结合案例,写出你的理解。 机器学习是让计算机具有学习的能力,无需进行明确编程。 —— 亚瑟·萨缪尔,1959 计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习 阅读全文

posted @ 2020-04-02 20:56 chenjd 阅读(265) 评论(0) 推荐(0)

导航