验证数据是否满足正态分布——Q-Q图和P-P图

Q-Q图

  Q-Q图是一种散点图,对应于正态分布的Q-Q图,就是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图. 要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值. 用QQ图还可获得样本偏度和峰度的粗略信息.
  Q-Q图可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。P-P图和Q-Q图的用途完全相同,只是检验方法存在差异
  由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.
  用QQ图还可获得样本偏度和峰度的粗略信息.

 

这篇文章是关于Q-Q图的程序设计: 

 http://www.docin.com/p-44022618.html

 

有个关于Q-Q图和P-P图的R语言例子:

n=100 

a=rnorm(n) #产生100个正态随机变量

p=pnorm(a) #求正态分布函数值(正态累积概率)

t=rank(a)/n#求观察累积概率

q=qnorm(t) #求分位数值

plot(p,t)#画P-P图 

plot(a,q) #画Q-Q图

 

有关分位数的概念:

分位数  

quantile fractile

  分位数又称百分位点,或者下侧分位数。

定义
  设连续随机变量X的分布函数为F(X),密度函数为p(x)。那么,对任意0<p<1的p,称F(X)=p的x为此分布的分位数,或者下侧分位数。简单的说,分位数指的就是连续分布函数中的一个点,这个点对应概率p。

其他定义

  若概率0<p<1,随机变量X或它的概率分布的分位数Za。是指满足条件p(X>Za)=α的实数。
  分位数有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下:
  当随机变量X的分布函数为 F(x),实数α满足0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα,
  上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ,

 

  双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使 P{X>λ2}=1-F(λ2)=0.5α的数λ2 如t分布的分位数表,自由度f=20和α=0.10时的双侧分位数为正负1.7247。  

posted on 2012-08-08 17:02  香格里拉\(^o^)/  阅读(20918)  评论(0编辑  收藏  举报