2019年8月19日

概率笔记12——多维正态分布的最大似然估计

摘要:我们在前面的章节中见识过二维正态分布,(X,Y)服从参数为μ1, μ2, σ1, σ2, ρ的二维正态分布,记作(X, Y)~N(μ1, μ2, σ1, σ2, ρ),它的密度函数: 其中μ1是第1维度的均值,σ12是第1维度的方差,ρ是将两个维度的相关性规范到-1到+1之间的统计量,称为样本的相关 阅读全文

posted @ 2019-08-19 19:34 我是8位的 阅读 (8) 评论 (0) 编辑

2019年8月14日

概率笔记11——一维正态分布的最大似然估计

摘要:正态分布密度函数是: 若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。当μ=0,σ2=1是,称为标准正态分布。不需要记住这个复杂的公式,知道它的意义即可,在使用时可以随时查阅。 在研究正态分布时,我们认为每个样本都是等权的,因此μ是随机变量的均值,控制了曲线的位置,σ2控 阅读全文

posted @ 2019-08-14 17:52 我是8位的 阅读 (12) 评论 (0) 编辑

2019年8月7日

最小二乘法(2)——多项式函数能够拟合非线性问题原理

摘要:一个复杂的多项式可以“过拟合”任意数据,言外之意是多项式函数可以接近于任何函数,这是什么道理呢? 泰勒公式 欲理解多项式函数的过拟合,必先理解泰勒公式。 泰勒公式是一种计算近似值的方法,它是一个用函数某点的信息描述在该点附近取值的公式。已知函数在某一点的各阶导数值的情况之下,泰勒公式可以用这些导数值 阅读全文

posted @ 2019-08-07 15:58 我是8位的 阅读 (24) 评论 (0) 编辑

2019年8月5日

最小二乘法(1)——线性问题

摘要:远处有一座大楼,小明想要测量大楼的高度,他想到了一个好办法: 小明找到一根长度是y1的木棍插在地上,当他趴在 A点时,木棍的顶端正好遮住楼顶,此时他记录下自己的观察点到木棍的距离x1 。之后小明又找到另一个长度是y2的木棍,用同样的方法再观察一次,这次记录的数值是 x2。由于测量时存在误差,因此 x 阅读全文

posted @ 2019-08-05 19:31 我是8位的 阅读 (28) 评论 (0) 编辑

2019年7月1日

概率笔记10——矩估计和最大似然

摘要:估计 生活中我们经常估计一些数值,比如从家到学校要走多久?一颗大白菜大概多少斤?凭什么估计出具体数值呢?“估计”不是瞎猜,是根据已有数据计算的。从家到学校往返过多次,手上也拿过无数颗白菜,此时我们会凭借心中的尺度计算出一个大约的数值。 矩估计 矩估计,即矩估计法,也称“矩法估计”,是利用已有样本估计 阅读全文

posted @ 2019-07-01 17:44 我是8位的 阅读 (120) 评论 (0) 编辑

2019年6月28日

概率笔记9——大数定律

摘要:在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。 当我们掷一枚硬币时,说正面朝上的概率是1/2,是这样吗?当你掷十次硬币时,正面朝上的概率可未必是1/2,这个结果带有很强的随机性,并没有什么规律可言。但是当投掷的次数足够多时,规律就呈现出来了。概率研究的是随机现象背后的客观 阅读全文

posted @ 2019-06-28 14:56 我是8位的 阅读 (175) 评论 (0) 编辑

2019年6月27日

概率笔记8——方差、均方差和协方差

摘要:除了数学期望外,方差、均方差、协方差也是重要的数字特征。 方差 方差的代数意义很简单,两个数的方差就是两个数差值的平方,作为衡量实际问题的数字特征,方差有代表了问题的波动性。 方差的意义 甲、乙二人是射击队最优秀的两名选手,教练组用每一枪的得分作为成绩,根据历史数据计算出二人的平均成绩,也就是数学期 阅读全文

posted @ 2019-06-27 15:31 我是8位的 阅读 (112) 评论 (0) 编辑

2019年6月26日

概率笔记7——数学期望

摘要:如果知道一个随机变量的分布函数,就能知道这个随机变量体现出的随机性的客观规律。但是很多时候我们不清楚分布函数是什么。有些时候,对于一批数据来说,未必一定要关心分布函数。比如一批产品,我们可能只关心这批产品的平均使用寿命,这里的平均使用寿命是随机变量的某个数字指标,称为随机变量的数字特征。数字特征与“ 阅读全文

posted @ 2019-06-26 11:01 我是8位的 阅读 (66) 评论 (0) 编辑

2019年6月25日

概率笔记6——多维随机变量

摘要:和其它问题一样,概率也可能同时受到多个条件的影响,例如考察某地区中学生的身体素质,随机地选取一名学生,观察学生的身高 X,体重 Y 和肺活量 Z 等指标。随机变量 X,Y,Z 来自同一样本空间,它们的取值可能相互影响。像这样同时考虑的多个随机变量,称为多维随机变量。本章以二维随机变量为例,介绍多维随 阅读全文

posted @ 2019-06-25 16:50 我是8位的 阅读 (120) 评论 (0) 编辑

2019年6月19日

异常检测(1)——局部异常因子算法

摘要:局部异常因子算法(Local Outlier Factor)通过计算“局部可达密度”来反映一个样本的异常程度,一个样本点的局部可达密度越大,这个点就越有可能是异常点。 k距离和k距离邻域 某一点P的k距离(k-distance)很容易解释,就是点P和距离点P第k近的点之间距离,但不包括P。假设P是学 阅读全文

posted @ 2019-06-19 16:16 我是8位的 阅读 (185) 评论 (0) 编辑

导航