统计工具之QQ图

正态 QQ 图和普通 QQ 图

分位数-分位数 (QQ) 图是两种分布的分位数相对彼此进行绘制的图。
评估数据集是否正态分布,并分别研究两个数据集是否具有相似的分布。

如何构建正态 QQ 图

首先,数据值经过排序,且累积分布值按照公式 (i– 0.5)/n 进行计算,其中字母表示总数为 n 的值中的第 i 个值(累积分布值给出了某个特定值以下的值所占的数据比例)。累积分布图通过以比较方式绘制有序数据和累积分布值得到(如下图中左上角的图表所示)。标准正态分布(平均值为 0 标准方差为 1 的高斯分布,如下图的中右上角的图表所示)的绘制过程与此相同。生成这两个累积分布图后,对与指定分位数相对应的数据值进行配对并绘制在 QQ 图中(见下图的底图所示)。

正态 QQ 图

如何构建普通 QQ 图

普通 QQ 图用于评估两个数据集的分布的相似程度。这些图的创建和所述的正态 QQ 图的过程类似,不同之处在于第二个数据集不一定要服从正态分布,使用任何数据集均可。如果两个数据集具有相同的分布,普通 QQ 图中的点将落在 45 度直线上。

普通 QQ 图

使用 QQ 图检查数据分布

正态 QQ 图上的点可指示数据集的单变量分布的正态性。如果数据是正态分布的,点将落在 45 度参考线上。如果数据不是正态分布的,点将会偏离参考线。

在下图中,标准正态分布的分位数值绘制在正态 QQ 图中的 x 轴上,数据集的相应分位数值绘制在 y 轴上。可以看到点落在 45 度参考线附近。与此线的主要偏离发生在高臭氧浓度值处。

 

正态 QQ 图工具可用于选择未落在参考线附近的点。所选的点的位置将高亮显示在 ArcMap 数据视图中。如下所示,这些点集中在圣弗朗西斯科湾区域附近(以下地图中粉红色阴影点)。

QQ 图地图

使用数据变换的示例

示例数据集的正态 QQ 图如下所示:

标准正态分布:变换的 QQ 图

请注意点如何偏离直线。

但是,当将对数变换应用于数据集时,点更接近 45 度参考线,如下图所示。

标准正态分布:QQ 对数变换

还可对正态 QQ 图工具中的数据应用 Box-Cox 和反正弦变换,以评估它们对分布的正态性的影响。

了解有关检查数据的分布的详细信息

posted @ 2015-06-04 22:49  prepat  阅读(10812)  评论(0编辑  收藏  举报