随笔分类 - Machine learning
摘要:[TOC] PCA 1. PCA最大可分性的思想 最大可分性: 样本点在超平面上的投影尽可能的分开 2. 基变换(线性变换) 3. 方差 如何选择一个方向或者基才是最优的?基于PCA最大可分思想,我们要找的方向是 降维后损失最小 ,可以理解为 投影后的数据尽可能分得开 ,而分散程度可以用
阅读全文
摘要:1. 为什么需要数据增强? (1)数据增强是扩充数据样本规模的一种有效的方法,深度学习是一种基于大数据的方法,数据的规模越大、质量越高就越好,模型也能够拥有更好的泛化能力。然而在实际采集数据的时候,往往很难覆盖全部的场景,比如光照条件,那么在训练模型的时候,就需要加入光照方面的数据增强; (2)即使
阅读全文
摘要:正则化策略 Since because of the function of being a potential tool for ensuring the generalization of the algorithm, studies on regularization of the algor
阅读全文
摘要:在机器学习算法中,我们通常将原始数据集划分为三个部分(划分要尽可能保持数据分布的一致性): (1)Training set(训练集): 训练模型 (2)Validation set(验证集): 选择模型 (3)Testing set(测试集): 评估模型 其中Validation set的作用是用来
阅读全文
摘要:偏差: 是指一个模型的在不同训练集上的平均性能和最优模型的差异,可以用来衡量一个模型的拟合能力。换句话说,偏差反映的是 预测值期望$E(f(x))$ 与 真实值$y$ 之间 偏移 了多少; 方差: 是指一个模型在不同训练集上的差异,可以用来衡量一个模型是否容易过拟合。换句话说,方差衡量的是 模型自身
阅读全文
浙公网安备 33010602011771号