协方差矩阵
在主成分分析中用到了协方差矩阵,这里详细介绍。
一、预备知识
* 数学期望
随机变量ξ的一切可能值xi 与对应的概率P(ξ = xi)的乘积之和叫做随机变量ξ的数学期望,记作E(ξ),即
E(ξ)=ΣxiP(ξ=xi) ...............................(1)
若P(ξ=xi)=1/n,i=1,2,...,n,则有
.............................(2)
数学期望具有线性性,即 E(aξ+bη)=aE(ξ)+bE(η)。对于常数c,有E(c)=c.
* 离差
ξ - E(ξ) 叫做随机变量 ξ 的离差。
* 方差
随机变量ξ 的离差平方的数学期望叫做随机变量ξ 的方差,记作D(ξ)或var(ξ),D(ξ) = E((ξ - E(ξ))2).
* 协方差
在统计学上,协方差用了刻画两个随机变量间的相关性,反映的是变量之间的二阶统计特征。两个随机变量xi 和xj ,它们的协方差定义为
易知下式成立:
n 维随机变量X=(x1,x2,...,xn)T的协方差矩阵定义为:
二、公式推导
设x1,x2,...,xn为一组随机变量,记X=(x1,x2,...,xn)T为由这n个随机变量构成的随机向量。假设每个随机变量有m个样本,得到样本矩阵为:
为推导公式方便起见,引入向量
即对应矩阵S的n个行,而
对应矩阵S的m个列,矩阵S可以表示成:
推导的第一步是给出ci,j的公式。由公式(2)知,E(xi) 和 E(xj) 可用下面两个公式近似:
(1.5)
令Y=(Xi - E(Xi))(Xj - E(Xj)):=(Y1,Y2,...,Ym),其中Yk=(xik - E(Xi))(xjk - E(Xj)), k=1,2,...,m ,可得
(1.6)
化简(1.6),展开中间括号,得
(1.7)
接下来的思路是:引入矩阵A,B,使得C = A - B,再分别化简A,B。
引入矩阵A=(ai,j)n*n,其中
(1.8)
(1.9)
再次引入矩阵B=(bi,j)n*n,其中
(1.10)
(1.11)
所以:
(1.12)
至此,协方差矩阵C的推导就完成了。如果想将上式的两项合并成一项,则有
(1.13)
浙公网安备 33010602011771号