均值和最小二乘法

有一维数组 [x1,x2...xn]，要求一个值X，使得：

F(X) = (X-x1)²+(X-x2)²+...(X-xn)² = min

F(X) = nX² - 2 * (x1+x2+....+xn) + x1² + x2² + ...+xn² = min

对X求导，当dF/dX = 0时，F(X)有极小值；

2nX - 2 (x1+x2+....+xn) = 0

那么，X = (x1+x2+....+xn) / n

因此，在一维的情况下，最小二乘求参数X，和求均值一样；

使用矩阵的方法，先建立方程组：

X - x1 = 0

...

X - xn = 0

也就是方程组：

A_n*1X =b，等价于 [1,1,......] ^T X = [x1,x2...xn] ^T;

A^TAX = A^Tb

同样解得：X = (x1+x2+....+xn) / n

应用：在一维中，有[2,2,2,2,2,10]这样子的数组，找出其中的孤值

先求出 X = 均值 = 3.333

中误差 = sqrt [ [(2-3.333)² + (2-3.333)² + (2-3.333)² + (2-3.333)²+ (2-3.333)² + (10-3.333)² ] / (6-1)] = 3.1622

假如一维数组是对一段距离的观测值，假设服从正态分布N[ μ，σ²] , u应该是接近2的数字，但实际上是不可知道的，样本量大时，通常用X和中误差来代替

|x_n - u| > 2σ 的概率，为 1 - 95.449974%；

|x_n - u| > 3σ 的概率，为 1 - 99.730020%；

所以，基于这个原理，|10 - 3.3333 | ≈ 2σ ，是属于小概率事件，所以认为10是孤值；

加权最小二乘法；

假如，为上面每个数字，求加权平均值，假如权值分别为[p1,p2....pn]，假如为[1,1,1,1,1,1/5]

加权并不是：X =（ 2+ 2 + 2 + 2 +2 + 1 / 5 * 10 ）/ 6 = 2；

而是F(X) = p1(X-x1)²+p2(X-x2)²+...p3(X-xn)² = min

F'(X) = 2 (p1 + p2 + ... pn) - 2 (p1x1 + p2x2 + ... + pnXn)

因此X = (p1x1 + p2x2 + ... + pnXn) / (p1 + p2 +...+pn) = 12 / 5.2 = 2.3

如同解 A^TPAX = A^TPb

p越大，说明对某个观测值越信赖，对其误差也越信赖；

关于误差传播

假如x经过n次读数，其中误差 = Σ(x_i - x_avg)² / n，用矩阵的形式，就是Dxx = [x₁-x_{avg ，}x₂-x_avg，...x_n-x_avg] [x₁-x_{avg ，}x₂-x_avg，...x_n-x_avg] ^T/ n

* 定义函数E(x)为求x的均值，那么Dxx = E[ [x₁-x_{avg ，}x₂-x_avg，...x_n-x_avg] [x₁-x_{avg ，}x₂-x_avg，...x_n-x_avg] ^T]

假如 y = ax，那么，其中误差 = Σ(ax_i - ax_avg)² / n = a²，就是Dyy = a²Dxx

因此，在一元的情况下 y = ax，y的方差D(Y) = a²Dxx

多元的情况下：

z = ax - by ，用矩阵的形式表示，那么 Z = [a,b][x,y]^T= KX

E(Z) = KE(X)

证明：

E(X) = [E(x),E(y)]^T

E(Z) = ∑z / n = a * ∑x / n + b∑y / n = aE(x) + bE(y) = K[E(x),E(y)]^T = KE(X)

D(Z) = E ( [Z-E(Z)] [Z-E(Z)]^T)

　　 = E ( [KX - KE(X)] [ KX - KE(X)]^T)

　　 = E ( K[X - E(X)] [ X - E(X)]^TK^T) (KA)^T = A^TK^T

　　 = KE ( [X - E(X)] [ X - E(X)]^T) K^T

Dxx = E ( [X - E(X)] [ X - E(X)]^T) = [x-x_{avg ，}y-y_avg] ^T [x-x_{avg ，}y-y_avg] / n

X = [x,y]^T, E(X) = [E(x),E(y)]^T

因此，Dxx 对角 (x-E(x))(x-E(x))^T / n，为x的方差； (y-E(y))(y-E(y))^T / n 为y的方差；

非对角 (x-E(x))(y-E(y))^T / n ，为x和y的协方差；

协方差的本质，是形容X的曲线，和Y的曲线的相似程度，其横轴均为样本序列

在实际解算的时候，如果两种观测量（x和y）是完全不相关的，例如： x代表测角、y代表测距，即使(x-E(x))(y-E(y))^T / n ≠ 0，在Dxx的非对角处，任然写为0值；

因此求Dzz要追根朔源

假如有：

z₁ = a₁x + b₁y

z₂ = a₂x + b₂y

z1和z2如何才是独立观测量，完全不相关？

等价于Dzz，非对角线元素为0

隐含条件：

1. a₁、b₁不能同时为0 ，否则相当于Z1没有意义；

2. a₂、b₂不能同时为0 ，否则相当于Z2没有意义；

3. σ_xx和 σ_yy 均不能等于0，否则解算没有意义，因为没有误差传递；

那么，要使得非对角线为0，那么：

1. a1 = 0 ，b2 = 0, σ_xy= 0；

1. b1 = 0 ，a2 = 0, σ_xy= 0；

没有别的选择；

因此，x、y必须是独立观测的，不相关的观测量，而且，Z的方程组，每条方程的自变量均不相同，要么：

z₁ = a₁x

z₂ = b₂y

或者

z₁ = b₁y

z₂ = a₂x

posted on 2019-08-15 18:56 耀礼士多德阅读(4172) 评论(0) 收藏举报

刷新页面返回顶部

耀礼士多德

均值和最小二乘法

导航

公告