非参数检验
游程检验(Run Test)知识点详解与推导
一、非参数检验与游程检验的定位
参数检验依赖总体分布的强假定(如正态分布),当总体分布未知、假定不满足时,推断结果会出现偏差。非参数检验仅对总体做极弱的分布假定,适用性更广、稳健性更强。
游程检验是经典的非参数检验方法,核心有两大应用场景:
- 检验单样本序列的随机性(统计推断的核心前提);
- 检验两个独立样本是否来自同分布总体。
二、基础概念定义
1. 0-1序列变换
设按顺序得到的样本观测序列为 \(x_1,x_2,\cdots,x_n\),计算样本中位数 \(m_e\):
- 小于 \(m_e\) 的 \(x_i\) 替换为0;
- 大于或等于 \(m_e\) 的 \(x_i\) 替换为1;
最终得到仅由0、1构成的二元序列,记0的个数为 \(n_1\),1的个数为 \(n_2\),总样本量 \(n=n_1+n_2\)。
注:选择中位数做变换,可保证0和1的数量尽可能均衡,避免极端占比影响游程判断,且中位数不受极端值干扰,稳健性优于均值。
2. 游程与总游程数
- 0游程:以1为边界的连续一串0,称为1个0游程;
- 1游程:以0为边界的连续一串1,称为1个1游程;
- 总游程数 \(R\):0游程个数 + 1游程个数,即序列中连续相同数字的段数总和。
示例:序列 0 1 0 1 1 1 0 1 1 0 1 0 0
- 0游程共5个,1游程共4个,总游程数 \(R=5+4=9\)。
3. 游程数的随机性逻辑
随机序列的游程数应“适中”:
- \(R\) 过小:0/1出现聚集(如前半段全0、后半段全1),说明序列存在趋势性,非随机;
- \(R\) 过大:0/1交替过于频繁(如
010101…),说明序列存在周期性,非随机。
三、原假设下总游程数 \(R\) 的精确分布推导
前提设定
原假设 \(H_0\):序列是随机的。此时所有0和1的排列是等可能的,总排列数为 \(\binom{n_1+n_2}{n_1}\)(从 \(n\) 个位置中选 \(n_1\) 个放0,剩余放1)。
游程的核心特性:0游程和1游程必然交替出现,因此:
- 当 \(R=2k\)(偶数):0游程数 = 1游程数 = \(k\);
- 当 \(R=2k+1\)(奇数):两种游程数相差1,要么0游程 \(k\) 个、1游程 \(k+1\) 个,要么反之。
1. 隔板法基础:分游程的组合数
将 \(n_1\) 个不可区分的0分成 \(k\) 个非空连续组(对应 \(k\) 个0游程),等价于在 \(n_1\) 个0的 \(n_1-1\) 个空隙中插入 \(k-1\) 个隔板,分法数为 \(\binom{n_1-1}{k-1}\)。
同理,\(n_2\) 个1分成 \(k\) 个非空游程的分法数为 \(\binom{n_2-1}{k-1}\)。
2. 情况1:\(R=2k\)(偶数)的概率分布
\(R=2k\) 意味着0、1游程各 \(k\) 个,交替排列有两种可能:
- 以0游程开头、1游程结尾;
- 以1游程开头、0游程结尾。
两种情况的排列数均为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\),总符合条件的排列数为 \(2\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\)。
因此概率为:
其中 \(\lfloor \cdot \rfloor\) 为向下取整。
3. 情况2:\(R=2k+1\)(奇数)的概率分布
\(R=2k+1\) 分两个子情况:
- 0游程 \(k\) 个、1游程 \(k+1\) 个:序列首尾均为1,排列数为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k}\);
- 0游程 \(k+1\) 个、1游程 \(k\) 个:序列首尾均为0,排列数为 \(\binom{n_1-1}{k}\binom{n_2-1}{k-1}\)。
总符合条件的排列数为两者之和,因此概率为:
四、游程检验的期望与方差推导
为实现大样本正态近似,我们先推导 \(H_0\) 下 \(R\) 的期望与方差。
1. 游程数的示性函数分解
总游程数可分解为:第一个元素必然是1个游程的起点,后续每一个与前一个元素不同的位置,都会新增1个游程。定义示性函数:
则总游程数可表示为:
2. 期望 \(E(R)\) 推导
根据期望的线性性质:
其中 \(E(I_i) = P(x_i \neq x_{i-1})\),随机序列中相邻位置一0一1的概率为:
求和项共 \(n-1\) 个 \(I_i\),因此:
3. 方差 \(D(R)\) 推导
方差满足 \(D(R) = D\left(\sum_{i=2}^n I_i\right)\),结合示性函数的协方差特性(仅相邻 \(I_i\) 有协方差,不相邻的协方差为0),最终化简得到:
五、游程检验的两类应用与实施步骤
应用1:单样本序列的随机性检验
检验假设
\(H_0\):样本序列是随机的;\(H_1\):样本序列非随机。
小样本检验步骤(\(n_1,n_2 \leq 20\))
- 计算样本中位数,构造0-1序列,统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\);
- 给定显著性水平 \(\alpha\),查游程检验临界值表,得下临界值 \(c_1\)、上临界值 \(c_2\),满足 \(P(R\leq c_1)\leq\alpha/2\),\(P(R\geq c_2)\leq\alpha/2\);
- 决策:若 \(R_{obs}\leq c_1\) 或 \(R_{obs}\geq c_2\),拒绝 \(H_0\);否则不拒绝 \(H_0\)。
也可通过p值决策:\(p=2\min\{P(R\leq R_{obs}),P(R\geq R_{obs})\}\),若 \(p<\alpha\) 拒绝 \(H_0\)。
大样本近似检验(\(n_1,n_2 > 20\))
当样本量较大时,根据中心极限定理,\(R\) 近似服从正态分布,构造标准化检验统计量:
拒绝域为 \(|Z| \geq z_{\alpha/2}\)(\(z_{\alpha/2}\) 为标准正态分布上 \(\alpha/2\) 分位数),若满足则拒绝 \(H_0\)。
应用2:两总体同分布检验
检验假设
\(H_0\):两个总体的分布完全相同;\(H_1\):两个总体的分布不同。
检验逻辑
若 \(H_0\) 为真,两样本来自同一总体,合并排序后0、1应均匀混合,游程数 \(R\) 较大;若 \(H_0\) 不真,两样本会出现聚集,游程数 \(R\) 显著偏小。因此该检验为单侧检验,拒绝域为 \(\{R\leq c\}\)。
实施步骤
- 将两个独立样本合并,从小到大排序,来自总体X的观测值记为0,来自总体Y的记为1,得到0-1序列;
- 统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\);
- 小样本查临界值表,大样本用正态近似计算Z统计量,拒绝域为 \(Z \leq -z_{\alpha}\);
- 决策:若满足拒绝域条件,拒绝 \(H_0\),认为两总体分布不同;否则不拒绝 \(H_0\)。
六、游程检验核心知识点归纳总结
| 分类 | 核心内容 |
|---|---|
| 方法定位 | 非参数检验方法,不依赖总体分布形式,稳健性强 |
| 核心用途 | 1. 单样本序列的随机性检验;2. 两独立样本的同分布检验 |
| 基础定义 | 游程:连续相同的0/1构成的段;总游程数R=0游程数+1游程数 |
| 分布特性 | 小样本下有精确分布,分R为偶数/奇数两种情况推导;大样本下渐近正态分布 |
| 期望与方差 | \(E(R)=1+\frac{2n_1n_2}{n}\);\(D(R)=\frac{2n_1n_2(2n_1n_2-n)}{n^2(n-1)}\) |
| 随机性检验 | 双侧检验,拒绝域 \(\{R\leq c_1\}\cup\{R\geq c_2\}\),检验序列是否随机 |
| 两总体同分布检验 | 单侧检验,拒绝域 \(\{R\leq c\}\),检验两总体分布是否一致 |
| 适用条件 | 小样本用精确分布;\(n_1,n_2>20\) 时用正态近似效果良好 |
| 优势 | 对总体分布无要求,计算简单,可快速判断序列的随机性/分布一致性 |
| 局限 | 存在大量打结值(相同观测值)时,游程数判断受影响,需调整或更换方法 |
符号检验(Sign Test)知识点详解与推导
一、符号检验的核心定位与基本思想
符号检验是经典的非参数检验方法,核心用于连续总体的分位数检验(最常用为中位数检验),也是配对设计差异检验的常用非参数方法。
核心特性
- 无分布依赖:无需对总体分布做任何强假定(如正态性),仅要求总体为连续型,适用范围极广;
- 信息利用:仅利用样本观测值与待检验值的差值正负符号做推断,完全不依赖差值的绝对大小,因此对异常值、极端值的稳健性极强;
- 核心逻辑:通过正号、负号的数量是否符合原假设下的概率分布,判断是否拒绝原假设。
二、基础场景:总体中位数的符号检验(例7.6.2详解)
问题设定
设连续总体\(X\)的分布函数为\(F(x)\),中位数为\(m_e\),满足\(F(m_e)=0.5\)。待检验假设为:
即检验总体中位数为0。
步骤1:构造符号统计量
设\(x_1,x_2,\cdots,x_n\)为来自总体\(X\)的样本,定义符号函数:
记正号的总个数为符号统计量:
\(S^+\)的含义为:样本中大于0的观测值的个数。
步骤2:原假设下\(S^+\)的分布推导
当\(H_0\)成立时,总体中位数为0,因此:
- 单个样本观测值大于0的概率\(P(x_i>0)=1-F(0)=0.5\);
- 单个样本观测值小于等于0的概率\(P(x_i\leq0)=F(0)=0.5\)。
因此,每个\(y_i\)独立同服从伯努利分布\(b(1,0.5)\)(单次试验成功概率为0.5,成功即\(x_i>0\))。
\(n\)个独立伯努利试验的成功次数之和服从二项分布,因此在\(H_0\)为真时:
步骤3:检验逻辑与拒绝域
\(H_0\)成立时,\(S^+\)的期望为\(E(S^+)=n\times0.5 = n/2\),即正号个数应在总样本量的一半附近。
- 若\(S^+\)过大:说明样本中正数远多于负数,中位数大概率大于0,拒绝\(H_0\);
- 若\(S^+\)过小:说明样本中负数远多于正数,中位数大概率小于0,拒绝\(H_0\)。
因此双侧检验的拒绝域形式为:
其中临界值\(c_1,c_2\)满足:
\(\alpha\)为给定的显著性水平。
三、一般场景:总体\(p\)分位数的符号检验(完整推导)
1. \(p\)分位数的定义
对于连续总体\(X\),分布函数为\(F(x)\),其\(p\)分位数\(x_p\)(\(0<p<1\))满足:
连续总体下,\(x_p\)存在且唯一,分布函数\(F(x)\)严格单调递增。
2. 待检验假设与等价转化
我们要检验的原假设与备择假设为:
其中\(x_0\)为给定的常数。
核心等价性推导
-
定义符号函数与成功概率:
对样本\(x_1,x_2,\cdots,x_n\),定义:\[y_i = \begin{cases} 1, & x_i > x_0 \\ 0, & x_i \leq x_0 \end{cases}, \quad i=1,2,\cdots,n\]记单次试验的成功概率:
\[\theta = P(y_i=1) = P(X > x_0) = 1 - F(x_0) \] -
原假设的等价转化:
由于\(F(x)\)严格单调递增,因此:\[x_p \leq x_0 \iff F(x_0) \geq F(x_p) = p \]两边取补集得:
\[1 - F(x_0) \leq 1 - p \iff \theta \leq 1-p \]反之,若\(\theta \leq 1-p\),则\(1-F(x_0)\leq1-p \implies F(x_0)\geq p=F(x_p) \implies x_0\geq x_p\),即\(H_0\)成立。
因此,原分位数检验问题完全等价于二项分布的参数检验问题:
3. 符号统计量的分布
\(y_1,y_2,\cdots,y_n\)独立同服从伯努利分布\(b(1,\theta)\),因此符号统计量:
服从二项分布\(b(n,\theta)\),即:
4. 拒绝域与\(p\)值计算
对于等价的二项分布单边检验,\(S^+\)越大,说明\(\theta\)越大,越倾向于拒绝\(H_0\),因此拒绝域形式为:
其中临界值\(c\)为满足下式的最小整数:
注:\(H_0\)为\(\theta\leq1-p\),最不利情况为\(\theta=1-p\)(边界值),此时犯第一类错误的概率最大,因此用\(\theta=1-p\)计算临界值,可保证整个\(H_0\)范围内第一类错误概率不超过\(\alpha\)。
\(p\)值计算
记符号统计量的观测值为\(S_0^*\),则该检验的\(p\)值为:
其中\(b(i;n,1-p)=\binom{n}{i}(1-p)^i p^{n-i}\)为二项分布的概率质量函数。
若\(p<\alpha\),则拒绝原假设\(H_0\)。
四、三种假设形式的符号检验完整总结
基于上述推导,我们可以得到分位数检验的三种完整形式,对应左侧单边、右侧单边、双侧检验,如下表所示:
| 原假设\(H_0\) | 备择假设\(H_1\) | 等价二项检验 | 拒绝域形式 | 检验的\(p\)值 |
|---|---|---|---|---|
| \(x_p \leq x_0\) | \(x_p > x_0\) | \(H_0:\theta\leq1-p\) vs \(H_1:\theta>1-p\) | \(W_Ⅰ=\{S^+ \geq c\}\) | \(\sum_{i=S_0^*}^n b(i;n,1-p)\) |
| \(x_p \geq x_0\) | \(x_p < x_0\) | \(H_0:\theta\geq1-p\) vs \(H_1:\theta<1-p\) | \(W_Ⅱ=\{S^+ \leq c\}\) | \(\sum_{i=0}^{S_0^*} b(i;n,1-p)\) |
| \(x_p = x_0\) | \(x_p \neq x_0\) | \(H_0:\theta=1-p\) vs \(H_1:\theta\neq1-p\) | \(W_Ⅲ=\{S^+ \leq c_1 \text{ 或 } S^+ \geq c_2\}\) | \(2\min\left\{ \sum_{i=0}^{S_0^*} b(i;n,1-p), \sum_{i=S_0^*}^n b(i;n,1-p), 0.5 \right\}\) |
补充说明
- 左侧单边检验的推导逻辑:\(x_p\geq x_0 \implies F(x_0)\leq p \implies \theta=1-F(x_0)\geq1-p\),\(S^+\)越小越拒绝\(H_0\);
- 双侧检验的\(p\)值取单侧\(p\)值的2倍,同时与0.5取最小值,避免\(p\)值超过1(当\(S_0^*\)接近\(n/2\)时,单侧\(p\)值可能大于0.5,此时\(p\)值最大为1)。
五、大样本正态近似
当样本量\(n\)较大时(通常要求\(np\geq5\)且\(n(1-p)\geq5\)),根据中心极限定理,二项分布\(b(n,\theta)\)可近似为正态分布:
在\(H_0\)成立时,\(\theta=1-p\),因此构造标准化检验统计量:
连续性修正
由于二项分布是离散分布,正态分布是连续分布,为提高近似精度,需进行连续性修正:
- 右侧单边检验(\(S^+\geq c\)):修正为\(Z = \frac{S^+ - 0.5 - n(1-p)}{\sqrt{np(1-p)}}\),拒绝域\(Z\geq z_\alpha\);
- 左侧单边检验(\(S^+\leq c\)):修正为\(Z = \frac{S^+ + 0.5 - n(1-p)}{\sqrt{np(1-p)}}\),拒绝域\(Z\leq -z_\alpha\);
- 双侧检验:拒绝域\(|Z|\geq z_{\alpha/2}\)。
其中\(z_\alpha\)为标准正态分布的上\(\alpha\)分位数。
六、符号检验的经典应用:配对样本差异检验
符号检验最常用的场景之一,是配对设计的非参数差异检验,作为配对t检验的替代方法(当配对差值不满足正态性时)。
问题设定
配对设计样本:\((x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)\),其中\(x_i\)为处理A的观测值,\(y_i\)为处理B的观测值,差值\(d_i = x_i - y_i\)。
待检验假设:两个处理的效应无差异,即差值\(d_i\)的中位数为0,对应:
检验步骤
- 计算配对差值\(d_i=x_i-y_i\);
- 定义符号函数:\(y_i=1\)当\(d_i>0\),\(y_i=0\)当\(d_i\leq0\),统计正号个数\(S^+\);
- 此时\(p=0.5\),对应中位数检验,\(H_0\)下\(S^+\sim b(n,0.5)\);
- 按双侧检验计算临界值或\(p\)值,做出决策。
七、符号检验的优缺点与适用条件
适用条件
- 总体为连续型(保证打结值\(x_i=x_0\)的概率为0);
- 待检验目标为总体分位数(尤其是中位数),或配对样本的效应差异;
- 总体分布未知、不满足参数检验的正态性假定,或存在极端异常值。
优势
- 无分布依赖,适用范围极广,不受总体分布形式的限制;
- 稳健性极强,仅利用符号信息,完全不受极端异常值的影响;
- 计算简单,逻辑直观,易于理解和实现;
- 可用于有序分类数据(仅能比较大小、无法计算数值差异的等级数据)。
局限
- 信息利用率低:完全丢弃了差值的大小信息,当总体满足正态性时,检验效能远低于配对t检验等参数方法;
- 打结值敏感:当存在大量\(x_i=x_0\)(差值为0)的打结情况时,样本量被压缩,检验效能大幅下降,此时更推荐使用Wilcoxon符号秩检验;
- 小样本下,二项分布的临界值可能无法恰好满足显著性水平\(\alpha\)的要求,检验的实际显著性水平会低于名义水平。
八、符号检验核心知识点归纳总表
| 分类 | 核心内容 |
|---|---|
| 方法定位 | 经典非参数检验方法,核心用于连续总体的分位数检验、配对样本差异检验 |
| 核心原理 | 利用样本与待检验值差值的正负符号数量,通过二项分布做统计推断,不依赖总体分布 |
| 核心统计量 | 符号统计量\(S^+\):样本中大于待检验值\(x_0\)的观测值个数,服从二项分布\(b(n,\theta)\) |
| 检验前提 | 总体为连续型,保证分位数唯一、打结值概率为0 |
| 小样本检验 | 基于二项分布精确计算临界值或\(p\)值,分单边、双侧检验 |
| 大样本检验 | 基于中心极限定理做正态近似,需进行连续性修正,构造Z统计量 |
| 经典应用 | 1. 总体中位数检验;2. 配对设计的效应差异检验(配对t检验的非参数替代) |
| 核心优势 | 无分布依赖、稳健性极强(抗异常值)、计算简单、适用有序分类数据 |
| 核心局限 | 丢弃数值大小信息,检验效能低于参数方法;对大量打结值敏感 |
| 决策规则 | \(p\)值小于显著性水平\(\alpha\)时,拒绝原假设\(H_0\);否则不拒绝\(H_0\) |
符号检验例题详解(含完整推导、计算与原理对应)
一、例7.6.3 总体分位数的左侧单边符号检验
1. 问题背景与检验假设
- 业务背景:以往资料显示,该种圆钢90%的产品硬度不小于103 kg/mm²,即10%分位数\(x_{0.10}=103\)(10%分位数的定义:总体中10%的观测值≤\(x_{0.10}\),90%的观测值≥\(x_{0.10}\))。现抽取20根样本,检验该结论是否仍成立。
- 统计假设:\[H_0: x_{0.10} \geq 103 \quad \text{vs} \quad H_1: x_{0.10} < 103 \]显著性水平\(\alpha=0.05\)。
2. 原理对应(结合符号检验核心理论)
根据\(p\)分位数的定义,\(F(x_{0.10})=P(X \leq x_{0.10})=0.1\),原假设\(H_0: x_{0.10} \geq 103\)等价于:
定义符号统计量的成功概率:
因此原假设可等价转化为二项分布参数检验:
- 符号统计量\(S^+\):样本中硬度大于103的观测值个数(即差值\(x_i-103>0\)的正号个数);
- \(H_0\)成立时,\(S^+\)服从二项分布\(b(n, 0.9)\),其中样本量\(n=20\);
- 拒绝域逻辑:\(S^+\)越小,说明\(\theta\)越小,越倾向于拒绝\(H_0\),因此拒绝域为\(\{S^+ \leq c\}\)。
3. 详细解题步骤
步骤1:计算差值,构造符号序列
对每个样本硬度\(x_i\),计算差值\(z_i = x_i - 103\),结果如下:
| 样本序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|---|
| 硬度\(x_i\) | 142 | 134 | 119 | 98 | 131 | 102 | 154 | 122 | 93 | 137 |
| 差值\(z_i\) | 39 | 31 | 16 | -5 | 28 | -1 | 51 | 19 | -10 | 34 |
| 符号 | + | + | + | - | + | - | + | + | - | + |
| 样本序号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
|---|---|---|---|---|---|---|---|---|---|---|
| 硬度\(x_i\) | 86 | 119 | 161 | 144 | 158 | 165 | 81 | 117 | 128 | 113 |
| 差值\(z_i\) | -17 | 16 | 58 | 41 | 55 | 62 | -22 | 14 | 25 | 10 |
| 符号 | - | + | + | + | + | + | - | + | + | + |
步骤2:统计符号统计量的观测值
统计正号(\(z_i>0\))的个数,得\(S_0^+ = 15\)。
步骤3:计算检验的\(p\)值
左侧单边检验的\(p\)值为:\(H_0\)成立时,\(S^+\)小于等于观测值15的累积概率,即
二项分布概率计算:
- 二项分布\(b(20,0.9)\)的累积概率,\(P(S^+ \leq15) = 1 - P(S^+ \geq16)\)
- \(P(S^+ \geq16) = \sum_{i=16}^{20}\binom{20}{i}0.9^i0.1^{20-i} \approx 0.957\)
- 因此\(P(S^+ \leq15) = 1 - 0.957 = 0.043\)
步骤4:决策与结论
\(p=0.043 < \alpha=0.05\),因此拒绝原假设\(H_0\),不能认为该种圆钢的10%分位数\(x_{0.10}\)不小于103 kg/mm²,即原“90%产品硬度不小于103”的结论不成立。
4. 关键注意点
- 本题为左侧单边检验,拒绝域为\(S^+\)偏小的区域,\(p\)值为左侧累积概率;
- 原假设的边界值为\(\theta=0.9\),因此用二项分布\(b(20,0.9)\)计算概率,保证第一类错误概率不超过\(\alpha\);
- 若\(p\)值大于\(\alpha\),则不拒绝原假设,仅说明没有足够证据推翻原结论,而非证明原结论成立。
二、例7.6.4 配对样本的双侧符号检验
1. 问题背景与检验假设
- 业务背景:工厂两个化验室每天同时从冷却水中取样,测量含氯量,共11组配对数据,检验两个化验室的测定结果是否存在显著性差异。
- 统计假设:
记化验室A的测量误差分布为\(F(x)\),化验室B的为\(G(x)\),检验\[H_0: F(x) = G(x) \quad \text{vs} \quad H_1: F(x) \neq G(x) \]显著性水平\(\alpha=0.05\)。
2. 配对设计的处理逻辑
配对数据的核心问题:每天的含氯量本身存在差异,因此\(x_i\)(化验室A)和\(y_i\)(化验室B)的差异,既包含化验室的系统误差,也包含当天含氯量的真实值差异。
通过配对差值消除真实值的影响:
设\(x_i = \mu_i + \xi_i\),\(y_i = \mu_i + \eta_i\),其中\(\mu_i\)为第\(i\)天冷却水的真实含氯量,\(\xi_i\)、\(\eta_i\)为两个化验室的测量误差。
差值\(z_i = x_i - y_i = \xi_i - \eta_i\),完全消除了\(\mu_i\)的影响,仅保留两个化验室的误差差异。
当\(H_0\)成立时,\(\xi_i\)和\(\eta_i\)同分布,因此\(z_i = \xi_i - \eta_i\)的分布关于0对称,即\(P(z_i>0)=P(z_i<0)=0.5\),差值的中位数为0,可使用双侧符号检验。
3. 详细解题步骤
步骤1:计算配对差值,统计符号
根据表格数据,计算差值\(z_i=x_i-y_i\),并统计正负号:
| 序号\(i\) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 差值\(z_i\) | 0.03 | -0.04 | -0.16 | 0.01 | -0.06 | -0.05 | -0.02 | -0.1 | -0.11 | -0.07 | -0.12 |
| 符号 | + | - | - | + | - | - | - | - | - | - | - |
步骤2:统计符号统计量的观测值
统计正号(\(z_i>0\))的个数,得\(S_0^+ = 2\),无差值为0的打结值,样本量\(n=11\)。
步骤3:计算检验的\(p\)值
\(H_0\)成立时,\(S^+ \sim b(11, 0.5)\),双侧检验的\(p\)值为:
二项分布概率计算:
- 左侧累积概率:\(P(S^+ \leq 2) = \sum_{i=0}^{2} \binom{11}{i} 0.5^{11}\)
计算得:\(\binom{11}{0}0.5^{11} + \binom{11}{1}0.5^{11} + \binom{11}{2}0.5^{11} = (1+11+55)/2048 = 67/2048 \approx 0.0327\) - 右侧累积概率:\(P(S^+ \geq 2) = 1 - P(S^+ \leq1) \approx 0.994\)
- 取最小值乘以2,得\(p=2\times0.0327 = 0.0654\)
步骤4:决策与结论
\(p=0.0654 > \alpha=0.05\),因此不拒绝原假设\(H_0\),在0.05的显著性水平下,没有足够证据表明两个化验室的测定结果存在显著性差异。
4. 关键注意点
- 本题为双侧检验,\(p\)值取单侧最小累积概率的2倍,避免\(p\)值超过1;
- 配对符号检验的核心是通过差值消除配对个体的固有差异,仅关注处理/组间的差异,是配对t检验的非参数替代方法,适用于差值不满足正态性的场景;
- 若存在差值为0的打结值,通常的处理方式是剔除打结值,样本量\(n\)相应减少;
- 本题\(p=0.0654\)接近0.05,若放宽显著性水平至\(\alpha=0.1\),则会拒绝原假设,说明检验结果对显著性水平敏感,本质是符号检验的信息利用率低,检验效能弱于配对t检验。
三、两个例题的核心对比总结
| 对比维度 | 例7.6.3 分位数单边检验 | 例7.6.4 配对样本双侧检验 |
|---|---|---|
| 检验目标 | 检验总体10%分位数是否≥103 | 检验两个配对总体的分布是否相同 |
| 假设类型 | 左侧单边检验 | 双侧检验 |
| 符号统计量\(S^+\) | 样本值大于103的正号个数 | 配对差值为正的正号个数 |
| \(H_0\)下的分布 | \(b(20, 0.9)\) | \(b(11, 0.5)\) |
| \(p\)值计算 | 左侧累积概率\(P(S^+ \leq 15)\) | 2倍最小单侧累积概率 |
| 决策结果 | \(p<0.05\),拒绝\(H_0\) | \(p>0.05\),不拒绝\(H_0\) |
| 核心应用场景 | 总体分位数的检验 | 配对设计的组间差异检验 |
Wilcoxon秩和检验知识点详解与完整推导
一、秩和检验的核心定位
符号检验仅利用了观测值与中心位置差值的正负符号,完全丢弃了差值的大小信息,检验效能较低。Wilcoxon秩和检验(秩检验)由威尔科克森1945年提出,是经典的非参数检验方法,它同时结合了差值的符号和绝对值大小,充分利用样本信息,检验效能显著高于符号检验,且仍不依赖总体分布的正态性假定,适用范围极广。
秩和检验主要分为两大核心应用:
- 单样本/配对样本Wilcoxon符号秩检验:用于对称总体的中心位置检验(如配对设计的组间差异检验);
- 两独立样本Wilcoxon秩和检验(Mann-Whitney U检验):用于两个独立总体的位置差异检验,是两独立样本t检验的非参数替代方法。
二、基础概念:秩与秩统计量
1. 秩的定义
定义7.6.1 设\(x_1,x_2,\cdots,x_n\)是来自连续分布\(F(x)\)的简单随机样本,将观测值从小到大排序得到有序样本\(x_{(1)} \leq x_{(2)} \leq \cdots \leq x_{(n)}\),观测值\(x_i\)在有序样本中的序号\(r\)称为\(x_i\)的秩,记为\(R_i=r\)。
核心说明:连续总体中,观测值相等(打结)的概率为0,因此每个观测值的秩唯一确定。
例7.6.5 设\(n=6\),观测值为\(196,224,171,241,162,193\),从小到大排序为\(162,171,193,196,224,241\),对应秩为\(1,2,3,4,5,6\),因此原观测值的秩依次为\(4,5,2,6,1,3\)。
2. 秩统计量
定义7.6.2 设\(x_1,x_2,\cdots,x_n\)是来自连续总体的样本,\(R_i\)是\(x_i\)的秩,称向量\(R=(R_1,R_2,\cdots,R_n)\)为样本的秩统计量,基于秩统计量构造的检验方法统称为秩检验。
三、单样本/配对样本Wilcoxon符号秩检验
1. 检验场景与假设
符号秩检验适用于对称连续总体的中心位置检验,最典型的场景是配对设计的组间差异检验:
- 配对样本\((x_i,y_i)\),差值\(z_i=x_i-y_i\),检验两个总体的分布是否相同,等价于检验差值\(z_i\)的分布关于0对称,即总体中位数为0。
- 原假设与备择假设:\[H_0: \theta=0 \quad \text{vs} \quad H_1: \theta \neq 0 \]其中\(\theta\)为总体的对称中心(中位数)。
2. 符号秩统计量的定义
定义7.6.3 设\(x_1,x_2,\cdots,x_n\)是样本,记\(R_i\)为\(|x_i|\)在\((|x_1|,|x_2|,\cdots,|x_n|)\)中的秩,定义指示函数:
称符号秩和统计量:
\(W^+\)的含义为:所有正观测值的秩的总和。
核心逻辑:\(H_0\)成立时,总体关于0对称,正、负观测值的数量应接近,且绝对值的秩应均匀分布,\(W^+\)应接近总秩和的一半;若\(W^+\)过大或过小,说明正/负观测值的绝对值显著偏大,拒绝\(H_0\)。
3. 符号秩统计量的分布特性与推导
核心前提(\(H_0\)成立时)
- 总体关于0对称,因此\(P(x_i>0)=P(x_i<0)=0.5\),每个观测值的符号与绝对值的秩相互独立;
- 所有秩\(1,2,\cdots,n\)等可能地分配给正、负观测值,每个秩被计入\(W^+\)的概率为0.5,且相互独立。
期望\(E(W^+)\)的推导
将\(W^+\)拆解为秩的加权和:\(W^+ = 1\cdot I_1 + 2\cdot I_2 + \cdots + n\cdot I_n\),其中\(I_k\)为指示变量,代表秩为\(k\)的观测值为正,\(P(I_k=1)=0.5\)。
根据期望的线性性质:
方差\(Var(W^+)\)的推导
由于\(I_1,\cdots,I_n\)相互独立,协方差为0,因此:
其中\(Var(I_k)=0.5\times0.5=0.25\),且\(\sum_{k=1}^n k^2 = \frac{n(n+1)(2n+1)}{6}\),代入得:
总秩和关系
正号秩和\(W^+\)与负号秩和\(W^-\)满足:
因此\(W^- = \frac{n(n+1)}{2} - W^+\),二者完全线性相关,检验时仅需计算\(W^+\)即可。
4. 检验拒绝域与实施步骤
小样本检验(\(n\leq50\))
查Wilcoxon符号秩检验临界值表,得临界值\(W_{\alpha/2}(n)\)和\(W_{1-\alpha/2}(n)\),其中\(W_{1-\alpha/2}(n) = \frac{n(n+1)}{2} - W_{\alpha/2}(n)\)。
- 双侧检验拒绝域:\(\{W^+ \leq W_{\alpha/2}(n)\} \cup \{W^+ \geq W_{1-\alpha/2}(n)\}\)
- 左侧单侧检验(\(H_1:\theta<0\))拒绝域:\(\{W^+ \leq W_{\alpha}(n)\}\)
- 右侧单侧检验(\(H_1:\theta>0\))拒绝域:\(\{W^+ \geq W_{1-\alpha}(n)\}\)
大样本近似(\(n>50\))
根据中心极限定理,\(H_0\)成立时\(W^+\)近似服从正态分布,构造标准化检验统计量:
若存在打结(相同绝对值),需对分母进行修正,修正公式为:
其中\(g\)为结的个数,\(t_j\)为第\(j\)个结的长度(相同绝对值的个数)。
5. 例题7.6.6 完整详解(配对样本符号秩检验)
问题背景
两个化验室每天同步测量冷却水含氯量,共11组配对数据,检验两个化验室的测定结果是否存在显著差异,\(\alpha=0.05\)。
检验步骤
-
计算配对差值:\(z_i = x_i(\text{化验室A}) - y_i(\text{化验室B})\),结果如下:
\(i\) 1 2 3 4 5 6 7 8 9 10 11 \(z_i\) 0.03 -0.04 -0.16 0.01 -0.06 -0.05 -0.02 -0.1 -0.11 -0.07 -0.12 -
计算绝对值与秩:对\(|z_i|\)从小到大排序,赋予秩:
| \(|z_i|\) | 0.03 | 0.04 | 0.16 | 0.01 | 0.06 | 0.05 | 0.02 | 0.1 | 0.11 | 0.07 | 0.12 |
|:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |
| 秩\(R_i\) | 3 | 4 | 11 | 1 | 6 | 5 | 2 | 8 | 9 | 7 | 10 | -
计算符号秩和统计量:正差值的秩为3和1,因此\(W^+ = 3+1=4\)。
-
确定拒绝域与决策:
查临界值表得\(W_{0.025}(11)=10\),\(W_{0.975}(11)=\frac{11\times12}{2}-10=56\),拒绝域为\(\{W^+\leq10\}\cup\{W^+\geq56\}\)。
观测值\(W^+=4\leq10\),落在拒绝域内,因此拒绝原假设\(H_0\),认为两个化验室的测定结果存在显著差异。
与符号检验的对比
符号检验中,正号个数为2,\(p\)值为0.0654,在\(\alpha=0.05\)下不拒绝原假设;而符号秩检验利用了差值的大小信息,两个正差值的绝对值极小、秩极低,更能反映系统差异,检验效能显著更高。
四、两独立样本Wilcoxon秩和检验
1. 检验场景与假设
两独立样本秩和检验用于两个独立连续总体的位置差异检验,是两独立样本t检验的非参数替代方法,适用于数据不满足正态性、存在异常值的场景。
设两个独立总体的分布函数为\(F(x-\theta_1)\)和\(F(x-\theta_2)\)(分布形状相同,仅位置参数\(\theta\)不同),待检验的三类假设为:
| 类型 | 原假设\(H_0\) | 备择假设\(H_1\) |
|---|---|---|
| 右侧单侧 | \(\theta_1 \leq \theta_2\) | \(\theta_1 > \theta_2\) |
| 左侧单侧 | \(\theta_1 \geq \theta_2\) | \(\theta_1 < \theta_2\) |
| 双侧 | \(\theta_1 = \theta_2\) | \(\theta_1 \neq \theta_2\) |
2. 秩和统计量的定义
设\(x_1,x_2,\cdots,x_n\)是来自总体1的样本,\(y_1,y_2,\cdots,y_m\)是来自总体2的样本,将两组样本合并后从小到大排序,给每个观测值赋予秩\(1,2,\cdots,N\)(\(N=m+n\))。
记\(R_i\)为样本\(y_i\)在合并样本中的秩,定义Wilcoxon秩和统计量:
即第二组样本的秩的总和。
核心逻辑:\(H_0\)成立时,两个总体分布相同,两组样本的秩应均匀分布在\(1\)到\(N\)之间,\(W\)应接近理论期望;若\(W\)显著偏小/偏大,说明两组样本的位置存在显著差异,拒绝\(H_0\)。
3. 秩和统计量的分布特性与推导
核心前提(\(H_0\)成立时)
两个样本来自同一总体,因此\(m\)个\(y\)的秩是从\(1\)到\(N\)中随机抽取\(m\)个不同的数,所有组合等可能。
期望\(E(W)\)的推导
将\(W\)拆解为:\(W = \sum_{k=1}^N k\cdot I_k\),其中\(I_k\)为指示变量,代表秩\(k\)被选入\(y\)的秩中,\(P(I_k=1)=\frac{m}{N}\)。
根据期望的线性性质:
方差\(Var(W)\)的推导
通过指示变量的协方差化简,最终可得:
推导过程详见附录,核心结论与教材完全一致。
总秩和关系
两组样本的秩和满足:
因此用任意一组的秩和做检验,结果完全等价。
4. 检验拒绝域与实施步骤
小样本检验(\(m,n\leq20\))
查Wilcoxon两样本秩和检验临界值表,得临界值\(W_{\alpha}(m,n)\),其中\(W_{1-\alpha}(m,n) = m(m+n+1) - W_{\alpha}(m,n)\)。
- 左侧单侧检验(\(H_1:\theta_1>\theta_2\),\(y\)的位置偏小)拒绝域:\(\{W \leq W_{\alpha}(m,n)\}\)
- 右侧单侧检验拒绝域:\(\{W \geq W_{1-\alpha}(m,n)\}\)
- 双侧检验拒绝域:\(\{W \leq W_{\alpha/2}(m,n)\} \cup \{W \geq W_{1-\alpha/2}(m,n)\}\)
大样本近似(\(m,n\geq20\))
根据中心极限定理,\(H_0\)成立时\(W\)近似服从正态分布,构造标准化检验统计量:
若存在打结,需对方差进行修正:
其中\(N=m+n\),\(g\)为结的个数,\(t_j\)为第\(j\)个结的长度。
5. 例题7.6.7 完整详解(两独立样本秩和检验)
问题背景
对羊毛进行处理前后的含脂率检测,处理前样本量\(n=6\),处理后样本量\(m=5\),检验处理后含脂率是否显著下降,\(\alpha=0.05\)。
- 处理前:\(0.20, 0.24, 0.66, 0.42, 0.12, 0.25\)
- 处理后:\(0.13, 0.07, 0.21, 0.08, 0.19\)
- 检验假设:\(H_0:\theta_1=\theta_2\) vs \(H_1:\theta_1>\theta_2\)(处理后含脂率下降)
检验步骤
-
合并排序与赋秩:将两组样本合并后从小到大排序,标记处理后样本(\(y\))并赋予秩:
合并样本 0.07 0.08 0.12 0.13 0.19 0.20 0.21 0.24 0.25 0.42 0.66 组别 处理后 处理后 处理前 处理后 处理后 处理前 处理后 处理前 处理前 处理前 处理前 秩 1 2 3 4 5 6 7 8 9 10 11 -
计算秩和统计量:处理后样本的秩为\(1,2,4,5,7\),因此\(W=1+2+4+5+7=19\)。
-
确定拒绝域与决策:
查临界值表得\(W_{0.05}(5,6)=20\),拒绝域为\(\{W\leq20\}\)。
观测值\(W=19\leq20\),落在拒绝域内,因此拒绝原假设\(H_0\),认为处理后的羊毛含脂率显著下降。
五、秩和检验的关键补充说明
- 打结值的处理:当存在相同观测值(结)时,对相同观测值赋予平均秩,同时对方差进行修正,避免检验结果偏倚。
- 单侧检验的适配:符号秩检验和两样本秩和检验均可适配单侧检验,仅需调整拒绝域的方向,核心逻辑不变。
- 适用范围拓展:秩和检验不仅适用于连续型数值数据,也可用于有序分类数据(等级数据),这是参数t检验无法实现的。
- 检验效能:当总体满足正态性时,秩和检验的检验效能略低于t检验;当总体不满足正态性、存在异常值时,秩和检验的检验效能远高于t检验,稳健性极强。
六、核心非参数检验方法归纳总结表
| 检验方法 | 核心适用场景 | 检验统计量 | 原假设下的分布 | 期望 | 方差 | 核心优势 | 核心局限 |
|---|---|---|---|---|---|---|---|
| 符号检验 | 单样本分位数检验、配对样本差异检验 | 正号个数\(S^+\) | 二项分布\(b(n,p)\) | \(np\) | \(np(1-p)\) | 无分布依赖、计算极简、抗极端值 | 丢弃数值大小信息,检验效能最低 |
| Wilcoxon符号秩检验 | 对称总体中心位置检验、配对样本差异检验 | 正号秩和\(W^+\) | 符号秩分布 | \(\frac{n(n+1)}{4}\) | \(\frac{n(n+1)(2n+1)}{24}\) | 结合符号与数值大小,检验效能高、稳健性强 | 要求总体分布对称,大量打结时效能下降 |
| Wilcoxon两样本秩和检验 | 两独立总体的位置差异检验 | 样本秩和\(W\) | 秩和分布 | \(\frac{m(m+n+1)}{2}\) | \(\frac{mn(m+n+1)}{12}\) | 不要求正态性,适配有序分类数据,是t检验的最优非参数替代 | 要求两总体分布形状相同,大量打结时需修正 |
posted on 2026-03-21 14:45 Indian_Mysore 阅读(10) 评论(0) 收藏 举报
浙公网安备 33010602011771号