协方差矩阵

 

协方差矩阵


   协方差标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集,最简单的是大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如,一个男孩子的猥琐程度跟他受女孩子的欢迎程度是否存在一些联系。协方差就是这样一种用来度量两个随机变量关系的统计量,我们可以仿照方差来定义协方差,用来度量各个维度偏离其均值的程度。

                             

  协方差的结果有什么意义呢?如果结果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),也就是说一个人越猥琐越受女孩欢迎。如果结果为负值, 就说明两者是负相关,越猥琐女孩子越讨厌。如果为0,则两者之间没有关系,猥琐不猥琐和女孩子喜不喜欢之间没有关联,就是统计上说的“相互独立”。

 

   协方差矩阵S:样本 X 的 d个属性 之间的 协方差。S 为 dxd

  

                    

    样本 X 有两个属性,共四个观测样本 。写成矩阵的形式,每一列为一个样本,带入公式E即可计算。用matlab算的话,要把X写成:每一行一个样本,然后调用cov(X).

 

posted @ 2014-10-05 20:33  月十日十  Views(487)  Comments(0)    收藏  举报