随笔分类 - 机器学习
摘要:来源:https://www.zhihu.com/question/29316149/answer/110159647目录 1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征
阅读全文
摘要:预处理数 1. 标准化:去均值,方差规模化 Standardization标准化:将特征数据的分布调整成标准正太分布,也叫高斯分布,也就是使得数据的均值维0,方差为1. 标准化的原因在于如果有些特征的方差过大,则会主导目标函数从而使参数估计器无法正确地去学习其他特征。 标准化的过程为两步:去均值的中
阅读全文
摘要:最大似然估计法的基本思想 最大似然估计法的思想很简单:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个 作为真 的估计。 我们分两种情进行分析: 1.离散型总体 设 为离散型随机变量,其概率分布的形式为 ,则样本 的概率分布为 ,在 固定时,上式表示 取值 的概率;当 固定时
阅读全文
摘要:数学期望(mean)(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。 离散型 离散型随机变量的一切可能的取值与对应的概率成绩之和称为称为该离散型随机变量的数学期望(若该求和绝对收敛),记为。它是简单算术平均的一种推广,类似加权平
阅读全文

浙公网安备 33010602011771号