随笔分类 - 数理统计相关
摘要:数学期望:又叫均值,是一种概率论概念,样本出现的情况结合出现的概率,是一种加权平均。 举例:如果一个人的身高是180,但是采用不同的仪器多次测量,就出现了不同的测量值,这个时候可以多次测量值/测量次数,就叫均值,是又真实值做参考的,反应的是多次试验的平均结果。 平均值:是数理统计的概念,对观察样本的
阅读全文
摘要:1、什么是中心极限定理。 中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近于围绕总体均值的一个正态分布。因此可以根据多个样本均值的均值近似得出总体的均值估计。 其中要注意的几点: 总体本身的
阅读全文
摘要:该红色区域在一个2×8的矩形方框里面。使用蒙特卡洛方法,随机在这个矩形里面产生大量随机点(数量为N),计算有多少点(数量为count)落在红色区域内(判断条件为y<x**3),count/N就是落在红色区域的点的比例,根据相应比例即可求出红色区域的面积。代码如下: 下面为估算有多少个点落在红色区域,
阅读全文
摘要:泰勒公式通过把【任意函数表达式】转换(重写)为【多项式】形式,是一种极其强大的函数近似工具。 为什么说它强大呢? 多项式非常【友好】,三易,易计算,易求导,易积分 几何感觉和计算感觉都很直观,如抛物线和几次方就是底数自己乘自己乘几次 泰勒公式干的事情就是:使用多项式表达式估计(近似)f(x)在x=a
阅读全文
摘要:来源:http://blog.csdn.net/lzhf1122/article/details/72935323 作者:lzhf1122 基础知识: 假设空间中两点x,y,定义: 欧几里得距离, Mahalanobis距离, 不难发现,如果去掉马氏距离中的协方差矩阵,就退化为欧氏距离。那么我们就需
阅读全文
摘要:无偏估计 所谓总体参数估计量的无偏性指的是,基于不同的样本,使用该估计量可算出多个估计值,但它们的平均值等于被估参数的真值。 在某些场合下,无偏性的要求是有实际意义的。例如,假设在某厂商与某销售商之间存在长期的供货关系,则在对产品出厂质量检验方法的选择上,采用随机抽样的方法来估计次品率就很公平。这是
阅读全文
摘要:一、梯度下降、随机梯度下降、批量梯度下降 梯度下降:梯度下降中,对于θ 的更新,所有的样本都有贡献,也就是参与调整θ 。其计算得到的是一个标准梯度。因而理论上来说一次更新的幅度是比较大的。如果样本不多的情况下,当然是这样收敛的速度会更快。 随机梯度下降:随机梯度下降法,随机用样本中的一个例子来近似总
阅读全文
摘要:如何对右偏数据进行变换 现在,我们需要分情况讨论一下。在实际生活中,最常见的情形是靠近正无穷的一侧有一个长尾巴(如图1左),习惯上称为「右偏」(right-skewed)或「正偏态」(positive skewness)。许多人会有点儿困惑,觉得图上分布的那个峰明明是向左边负数一侧偏的,怎么叫「右偏
阅读全文
摘要:一、何为数据的偏态分布? 频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。 偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。 如果频数分布的高峰向左偏移,长尾向右侧延伸称
阅读全文

浙公网安备 33010602011771号