随笔分类 - 机器学习课堂笔记
摘要:文件系统 文件系统架构在硬盘,以前的机械硬盘、固态硬盘,可以抽象为分块的存储区域。从文件系统来看,在文件系统存储介质,和内存是相似的,用来存介质,尽管介质不同。 但是也有区别,主要是内存是意识性的,固态硬盘是非意识性的。内存是随机访问,硬盘读写的时候读写的时候,不是字节或者字。硬盘读写是安装块为单位
阅读全文
摘要:聚类 应用在无监督学习中。 X=[X1,X2,X3,,,,Xn] 上节课讲的降维实际是把每个数据的特征维度降低了,通过对数据本身进行分析,进行降维。 聚类,是在数据量这个角度 通过方法,对数据进行分析,找到K个代表,可以代表整个n个数据,n个数据归类到K个代表中。 聚类任务相关概念 定义:依据样本的
阅读全文
摘要:无监督降维 无监督有三类:降维、聚类、概率建模。 本节课主要讲降维和聚类。PCA(主成分分析) 降维的主要应用:一、数据可视化(Scatter plot)直接去掉某个维度会丢失大量数据信息。 降维具有如下一些优点: 1) 使得数据集更易使用。 2) 降低算法的计算开销。 3) 去除噪声。 4) 使得
阅读全文
摘要:卷积神经网络 传统监督学习过程:y = h(x) 图像作为输入的神经网络: 减少参数量:1神经元局部的连接,关注图像局部特征2空间上参数共享,保持图形特征的空间信息; 相关运算: 2维相关运算:h = filter2(f,I) h(x,y) = F& I(x,y) 卷积运算:同一个神经元作用于图像所
阅读全文
摘要:深度学习是什么? 机器学习与深度学习 早期:感知机 中期:神经网络 非神经网络时期 现代:深度学习 生物神经元和感知器 MP神经元模型 输入:其他n个神经元传递过来的输入信号。 处理:输入信号通过带权重的连接进行传递。 错误预测的代价 损失函数—交叉熵(用于输出值为0-1的模型) J(W)= 真实的
阅读全文
摘要:过拟合 模型的泛化能力:训练集、测试集。训练集上学到的模型在测试集上的性能。 本节课研究的是:源域和测试域来自相同的分布,独立同分布。 迁移学习transfer Learnig:源域和测试域来自不同的分布,就是迁移学习,很复杂。 欠拟合和过拟合都不行。 不过现实中条件有限,无法得知数据的真实分布,所
阅读全文
摘要:监督学习 按照经验数据分类:监督学习、无监督学习、强化学习。 监督学习框架:f(x)=y 训练:函数f 测试:将训练好的函数f应用到测试样本x,输出预测结果y=f(x) 监督学习方法:线性回归、分类-k最近邻、分类-逻辑回归、分类-支持向量机等等。 机器学习三要素:方法=模型表达+目标函数+优化算法
阅读全文
摘要:机器学习 考核方式 考勤30% 课堂讨论20% 大作业30% 期末考试20% 大作业 内容:知识点讲解(老师分配)+论文阅读报告(2020年以后的顶级论文) 形式:PPT(中英文不限制) 以小组为单位3-4人进行汇报,知识点讲解20分钟,论文报告15分钟,穿插讨论10分钟; 时间:周四,从第9周开始
阅读全文

浙公网安备 33010602011771号