菜鸟根据周志华老师pdf所写,盗了点图望谅解
错了请联系我更正
泛化误差 vs 经验误差
泛化误差:在‘“未来”样本上的误差
经验误差:在训练集上的误差 ps:个人觉得应该是在训练的过程中所带来的误差
误差是不是越小越好?
过拟合:如图3 ps:模型泛化能力太差,只能解决当前验证集 解决办法:增大数据的训练量, 采用正则化方法
欠拟合:模型没有很好地捕捉到数据特征,不能够很好地拟合数据 解决办法:增加特征量,减少正则化参数 正则化的出现是防止过拟合的 如图2

模型选择(评估方法,性能度量,比较检验)
评估方法:留出法,折交叉验证法,自助法
留出法:直接把集合 分为训练集和测试集,两个互斥 ,注意:两个集合需保持数据分布一致性。多次重复划分,测试集不能太大。也不能太小(0.2~0.3) ps:假如 某验证集正好取到一种特殊类型数据,就会带了额外误差,当数据明显的分为有限类时, 采取分层抽样选择测试数据,
折交叉验证法:交叉验证用于防止模型过于复杂而引起的过拟合.有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。我们先在一个子集上做分析其他子集用来验证。一开始的称之为训练集,而其他的子集称之为验证集 要求:训练集的比例足够多,一般大于一半,训练集和测试集要均匀抽样 k—交叉验证 k个子集 每个子集做一次测试集,其余作为训练集 重复k次,每次选择一个子集作为测试集,并将k次平均交叉验证识别正确率作为结果 优点:在每次循环中 所有的样本都用来训练model,因此最接近母体样本的分布,在训练过程中排出了随机因素的影响
自助法:
性能度量:是衡量模型泛化能力的评价标准,反映了任务需求 模型的好坏 不仅取决于算法与数据,还取决于任务需求
回归任务中常用均方误差 理解:预测值减去实际值的平方的和除以总数, 代价函数
错误率 +精度(精确率) = 1 图一错误率 图二精确率 ps:个人觉得 应该是一个预测函数,和一个真实函数 如果两个值相等 则属于图二,不等则属于图一

比较检验
在某种度量下得到的评估结果,能否作为评价优劣的依据? NO
测试性能 != 泛化性能
测试性能随着测试集的改变而改变
算法具有一定随机性
机器学习之“误差从哪儿来”

泛化性能是由学习算法的能力,数据的充分性以及学习任务本身的难度共同决定
方差:很多人应该都还记得在统计学中, 一个随机变量的方差描述的是它的‘’离散程度‘’, 也就是该随机变量在其期望值附近的 波动程度 . 取自维基百科一般化的方差定义:
偏差:这里的偏指的是 偏离 , 那么它偏离了什么到导致了误差? 潜意识上, 当谈到这个词时, 我们可能会认为它是偏离了某个潜在的 “标准”, 而这里这个 “标准” 也就是真实情况 (ground truth). 在分类任务中, 这个 “标准” 就是真实标签 (label).
高方差 低偏差 导致过拟合,低方差 高偏差 导致欠拟合 ps:
降低方差:增大数据,减少特征量
降低偏差:增大特征量,减少数据
一般采取判断某函数是高方差还是高偏差,简单的判断是看训练误差与测试误差的差距,差距大说明是高方差的,差距小说明是高偏差的。

浙公网安备 33010602011771号