随笔分类 - 机器学习
大三课程的机器学习
摘要:1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from tensorflow.keras.models import Sequential from tensorflow.keras.layers
阅读全文
摘要:1.简述人工智能、机器学习和深度学习三者的联系与区别。 (1)人工智能是目的,是结果;深度学习、机器学习是方法,是工具; (2)机器学习,一种实现人工智能的方法;机器学习都可以被精准地定义为:1、任务T;2、训练过程E;3、模型表现P; (3)深度学习则是一种实现机器学习的技术;深度学习使得机器学习
阅读全文
摘要:1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target,
阅读全文
摘要:1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv sms=open("D:\机器学习\SMSSpamCollection",'r',encoding='utf-8') csv_reader=csv.reader(sms, delimiter='\t') for
阅读全文
摘要:1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:分类和聚类都是把每一条记录归应到对应的类别,对于想用分析的目标点,都会在数据集寻找离它最近的点,二个都用到了NN算法,结果是一样的。 区别:对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的,比如对一个学
阅读全文
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 特征选择 特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征拿好的特征,差的特征就不要,特征在选择前后 可以改变特征部分的值、也可以不改变特征部分的值,只是选择后的特征维数肯定要比选择前小。 PCA PCA是一种分析、简化数据集
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归通过正则化来防止过拟合;正则化可以防止过拟合是因为过拟合的时候,拟合函数的系数往往非常大,而正则化是 通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况,以L2正则化为例,正则项会使权重趋于
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? Logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlinear model)。 这一家族
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 一、算法简介 1.1 什么是回归分析 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。通常使用曲线/线来拟合数据点,目
阅读全文
摘要:1. 应用K-means算法进行图片压缩。 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 from sklearn
阅读全文
摘要:扑克牌手动演练k均值聚类过程:>30张牌,3类 在其中选择了3张牌作为初始中心,即点数为1、2、3的牌放在上面作为中心 第1轮:聚类中心为1、2、3,新聚类中心为1、2、6 第2轮:聚类中心为1、2、6,新聚类中心为1、3,6 第3轮:聚类中心为1、3、6,新聚类中心为1、3、6 用sklearn.
阅读全文
摘要:高数笔记 导数就是曲线的斜率,是曲线变化快慢的反应 二阶导数是斜率变化快慢的反应,表征曲线凹凸性 二阶导数连续的曲线,往往称之为“光顺的” 常用函数的导数 泰勒公式 函数展开成无穷级数 方向导数 梯度 割线位于函数的上方 概率论 线性代数
阅读全文
摘要:Python环境 学习笔记 机器学习是在于给定一个任务,然后在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验;不断地提供合适、优值、大量的经验,该程序对于任务的性能逐步提高。 机器学习的一般流程是先要收集数据,然后进行数据清洗,建立工程,再数据建模 机器学习可分为有监督学习、无监
阅读全文

浙公网安备 33010602011771号