摘要: 监督集成学习 引言 主要有bagging、boosting、stacking三种,其中bagging需要基学习器同时具备高性能与高度的数据敏感性,boosting算法在训练有噪声数据时容易产生过拟合问题。 bagging 通过自助采样法得到不同分布的训练子集,然后用不同训练子集训练基学习器,最后采取 阅读全文
posted @ 2022-04-17 13:13 肖肖凯 阅读(261) 评论(0) 推荐(0)
摘要: 正则化作用 当模型复杂度过高时可能会导致过拟合,即模型学到了训练集上的一些非全局的特征,导致随着训练的进行训练误差逐渐较小但是验证误差不在减小反而增大。正则化用于解决过拟合问题,主要的正则化方法包括L1、L2正则化,Dropout,Early stopping,数据增强等。 正则化方法的外在表现是在 阅读全文
posted @ 2022-04-15 17:37 肖肖凯 阅读(341) 评论(0) 推荐(0)
摘要: #熵定义 \(s(x) = - \sum_iP(x_i)log_bP(x_i)\) 熵的定义表明了一个事件所含有的信息量,上式中$x_i$表示一个事件,$P(x_i)$表示该事件发生的概率。由定义可知,如果某事件发生概率为1,则它的熵为0。 独立事件的信息量可叠加。 由于事件发生的概率在[0,1]之 阅读全文
posted @ 2022-04-13 19:16 肖肖凯 阅读(501) 评论(0) 推荐(0)
摘要: 引言 在构建机器学习模型时,通常需要先采集数据,然后将数据分为训练集、验证集、测试集。训练集用于训练模型,验证集(如果数据量比较少可以采用交叉验证的方式)用于调整超参数,测试集则用于最后评估模型的性能。通常假设所有的样本都是独立同分布采样的。 经验误差、测试误差、泛化误差定义 经验误差指模型在训练集 阅读全文
posted @ 2022-04-12 21:18 肖肖凯 阅读(2706) 评论(0) 推荐(0)
摘要: 多进程图像定义 启动了的程序就是进程,一次可以启动多个程序,即多个进程交替推进 每启动一个进程,操作系统就会用一个专门的结构体PCB来实时记录这个进程,并按照合理的顺序推进进程(分配资源、进行调度) 以上即多进程图像 多进程图像存在于计算机使用始终 计算机启动过程中,最后是执行main.c函数进行一 阅读全文
posted @ 2022-04-04 15:23 肖肖凯 阅读(77) 评论(2) 推荐(0)
摘要: 操作系统接口连接的不是用户 用户通过命令行、图形按钮、应用程序等使用计算机,shell和图形界面本质也是程序,在操作系统启动之后就会一直运行的程序。 用户通过程序来使用操作系统接口 操作系统接口 用户通过程序使用计算机,一般与操作系统直接交互的就是一些普通的C代码与一些重要的函数,这些重要的函数就是 阅读全文
posted @ 2022-03-31 21:16 肖肖凯 阅读(386) 评论(1) 推荐(0)
摘要: 什么是操作系统? 系统软件 操作系统是计算机硬件与应用软件之间的一层软件,用来管理各种硬件以及给应用软件提供统一的接口。 冯诺伊曼存储程序思想 即将程序和数据放到计算机内粗存储器中,计算机在程序的控制下一步一步进行处理,基本步骤是不断地取值执行。 计算机启动过程 BIOS 计算机刚上电时处于实模式, 阅读全文
posted @ 2022-03-26 12:59 肖肖凯 阅读(118) 评论(2) 推荐(0)
摘要: split命令 Linux中的split命令用于将一个大文件切割成若干个小文件,一般用于切割文本文件,有两种切割模式: 按字节数切割,即按文件大小切割 按行数切割 split按字节数切割 格式如下 split -b [size] filename 例子 如上图中test.txt大小为14k,按照2k 阅读全文
posted @ 2022-03-22 21:54 肖肖凯 阅读(1255) 评论(0) 推荐(0)
摘要: 前言 本文讨论python中的流程控制特性,主要包括两个方面: with语句和上下文管理器,with语句会设置一个临时的上下文,交给上下文管理器控制,并且负责清理上下文。 for while try 语句中的else子句 if语句之外的else块 for/else 只有当for循环运行完毕,即没有被 阅读全文
posted @ 2022-03-15 11:48 肖肖凯 阅读(64) 评论(0) 推荐(0)
摘要: 迭代器模式 迭代器模式与yield关键字 扫描内存中放不下的数据集时,需要惰性获取数据,即按需一次获取一个数据项,这就是迭代器模式。 python为了实现迭代器模式,加入了yield关键字,用于构建生成器。 所有生成器都是迭代器,因此生成器完全实现了迭代器接口。 一般认为,迭代器用于从一个集合中取出 阅读全文
posted @ 2022-03-14 22:01 肖肖凯 阅读(245) 评论(0) 推荐(0)