昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

非参数检验

游程检验(Run Test)知识点详解与推导

一、非参数检验与游程检验的定位

参数检验依赖总体分布的强假定(如正态分布),当总体分布未知、假定不满足时,推断结果会出现偏差。非参数检验仅对总体做极弱的分布假定,适用性更广、稳健性更强。

游程检验是经典的非参数检验方法,核心有两大应用场景:

  1. 检验单样本序列的随机性(统计推断的核心前提);
  2. 检验两个独立样本是否来自同分布总体

二、基础概念定义

1. 0-1序列变换

设按顺序得到的样本观测序列为 \(x_1,x_2,\cdots,x_n\),计算样本中位数 \(m_e\)

  • 小于 \(m_e\)\(x_i\) 替换为0;
  • 大于或等于 \(m_e\)\(x_i\) 替换为1;
    最终得到仅由0、1构成的二元序列,记0的个数为 \(n_1\),1的个数为 \(n_2\),总样本量 \(n=n_1+n_2\)

注:选择中位数做变换,可保证0和1的数量尽可能均衡,避免极端占比影响游程判断,且中位数不受极端值干扰,稳健性优于均值。

2. 游程与总游程数

  • 0游程:以1为边界的连续一串0,称为1个0游程;
  • 1游程:以0为边界的连续一串1,称为1个1游程;
  • 总游程数 \(R\):0游程个数 + 1游程个数,即序列中连续相同数字的段数总和。

示例:序列 0 1 0 1 1 1 0 1 1 0 1 0 0

  • 0游程共5个,1游程共4个,总游程数 \(R=5+4=9\)

3. 游程数的随机性逻辑

随机序列的游程数应“适中”:

  • \(R\) 过小:0/1出现聚集(如前半段全0、后半段全1),说明序列存在趋势性,非随机;
  • \(R\) 过大:0/1交替过于频繁(如010101…),说明序列存在周期性,非随机。

三、原假设下总游程数 \(R\) 的精确分布推导

前提设定

原假设 \(H_0\):序列是随机的。此时所有0和1的排列是等可能的,总排列数为 \(\binom{n_1+n_2}{n_1}\)(从 \(n\) 个位置中选 \(n_1\) 个放0,剩余放1)。

游程的核心特性:0游程和1游程必然交替出现,因此:

  • \(R=2k\)(偶数):0游程数 = 1游程数 = \(k\)
  • \(R=2k+1\)(奇数):两种游程数相差1,要么0游程 \(k\) 个、1游程 \(k+1\) 个,要么反之。

1. 隔板法基础:分游程的组合数

\(n_1\) 个不可区分的0分成 \(k\) 个非空连续组(对应 \(k\) 个0游程),等价于在 \(n_1\) 个0的 \(n_1-1\) 个空隙中插入 \(k-1\) 个隔板,分法数为 \(\binom{n_1-1}{k-1}\)
同理,\(n_2\) 个1分成 \(k\) 个非空游程的分法数为 \(\binom{n_2-1}{k-1}\)

2. 情况1:\(R=2k\)(偶数)的概率分布

\(R=2k\) 意味着0、1游程各 \(k\) 个,交替排列有两种可能:

  • 以0游程开头、1游程结尾;
  • 以1游程开头、0游程结尾。

两种情况的排列数均为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\),总符合条件的排列数为 \(2\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\)

因此概率为:

\[P(R=2k) = \frac{2 \binom{n_1 - 1}{k - 1} \binom{n_2 - 1}{k - 1}}{\binom{n_1 + n_2}{n_1}}, \quad k=1,2,\cdots,\left\lfloor \frac{n}{2} \right\rfloor \]

其中 \(\lfloor \cdot \rfloor\) 为向下取整。

3. 情况2:\(R=2k+1\)(奇数)的概率分布

\(R=2k+1\) 分两个子情况:

  1. 0游程 \(k\) 个、1游程 \(k+1\) 个:序列首尾均为1,排列数为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k}\)
  2. 0游程 \(k+1\) 个、1游程 \(k\) 个:序列首尾均为0,排列数为 \(\binom{n_1-1}{k}\binom{n_2-1}{k-1}\)

总符合条件的排列数为两者之和,因此概率为:

\[P(R=2k+1) = \frac{\binom{n_1 - 1}{k - 1}\binom{n_2 - 1}{k} + \binom{n_1 - 1}{k}\binom{n_2 - 1}{k - 1}}{\binom{n_1 + n_2}{n_1}}, \quad k=1,2,\cdots,\left\lfloor \frac{n-1}{2} \right\rfloor \]


四、游程检验的期望与方差推导

为实现大样本正态近似,我们先推导 \(H_0\)\(R\) 的期望与方差。

1. 游程数的示性函数分解

总游程数可分解为:第一个元素必然是1个游程的起点,后续每一个与前一个元素不同的位置,都会新增1个游程。定义示性函数:

\[I_i = \begin{cases} 1, & x_i \neq x_{i-1}, \quad i=2,3,\cdots,n \\ 0, & x_i = x_{i-1} \end{cases} \]

则总游程数可表示为:

\[R = 1 + \sum_{i=2}^n I_i \]

2. 期望 \(E(R)\) 推导

根据期望的线性性质:

\[E(R) = 1 + \sum_{i=2}^n E(I_i) \]

其中 \(E(I_i) = P(x_i \neq x_{i-1})\),随机序列中相邻位置一0一1的概率为:

\[P(x_i \neq x_{i-1}) = \frac{2n_1n_2}{n(n-1)} \]

求和项共 \(n-1\)\(I_i\),因此:

\[E(R) = 1 + (n-1)\cdot\frac{2n_1n_2}{n(n-1)} = 1 + \frac{2n_1n_2}{n} \]

3. 方差 \(D(R)\) 推导

方差满足 \(D(R) = D\left(\sum_{i=2}^n I_i\right)\),结合示性函数的协方差特性(仅相邻 \(I_i\) 有协方差,不相邻的协方差为0),最终化简得到:

\[D(R) = \frac{2n_1n_2(2n_1n_2 - n)}{n^2(n-1)} \]


五、游程检验的两类应用与实施步骤

应用1:单样本序列的随机性检验

检验假设

\(H_0\):样本序列是随机的;\(H_1\):样本序列非随机。

小样本检验步骤(\(n_1,n_2 \leq 20\)

  1. 计算样本中位数,构造0-1序列,统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\)
  2. 给定显著性水平 \(\alpha\),查游程检验临界值表,得下临界值 \(c_1\)、上临界值 \(c_2\),满足 \(P(R\leq c_1)\leq\alpha/2\)\(P(R\geq c_2)\leq\alpha/2\)
  3. 决策:若 \(R_{obs}\leq c_1\)\(R_{obs}\geq c_2\),拒绝 \(H_0\);否则不拒绝 \(H_0\)

也可通过p值决策:\(p=2\min\{P(R\leq R_{obs}),P(R\geq R_{obs})\}\),若 \(p<\alpha\) 拒绝 \(H_0\)

大样本近似检验(\(n_1,n_2 > 20\)

当样本量较大时,根据中心极限定理,\(R\) 近似服从正态分布,构造标准化检验统计量:

\[Z = \frac{R - E(R)}{\sqrt{D(R)}} \stackrel{近似}{\sim} N(0,1) \]

拒绝域为 \(|Z| \geq z_{\alpha/2}\)\(z_{\alpha/2}\) 为标准正态分布上 \(\alpha/2\) 分位数),若满足则拒绝 \(H_0\)


应用2:两总体同分布检验

检验假设

\(H_0\):两个总体的分布完全相同;\(H_1\):两个总体的分布不同。

检验逻辑

\(H_0\) 为真,两样本来自同一总体,合并排序后0、1应均匀混合,游程数 \(R\) 较大;若 \(H_0\) 不真,两样本会出现聚集,游程数 \(R\) 显著偏小。因此该检验为单侧检验,拒绝域为 \(\{R\leq c\}\)

实施步骤

  1. 将两个独立样本合并,从小到大排序,来自总体X的观测值记为0,来自总体Y的记为1,得到0-1序列;
  2. 统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\)
  3. 小样本查临界值表,大样本用正态近似计算Z统计量,拒绝域为 \(Z \leq -z_{\alpha}\)
  4. 决策:若满足拒绝域条件,拒绝 \(H_0\),认为两总体分布不同;否则不拒绝 \(H_0\)

六、游程检验核心知识点归纳总结

分类 核心内容
方法定位 非参数检验方法,不依赖总体分布形式,稳健性强
核心用途 1. 单样本序列的随机性检验;2. 两独立样本的同分布检验
基础定义 游程:连续相同的0/1构成的段;总游程数R=0游程数+1游程数
分布特性 小样本下有精确分布,分R为偶数/奇数两种情况推导;大样本下渐近正态分布
期望与方差 \(E(R)=1+\frac{2n_1n_2}{n}\)\(D(R)=\frac{2n_1n_2(2n_1n_2-n)}{n^2(n-1)}\)
随机性检验 双侧检验,拒绝域 \(\{R\leq c_1\}\cup\{R\geq c_2\}\),检验序列是否随机
两总体同分布检验 单侧检验,拒绝域 \(\{R\leq c\}\),检验两总体分布是否一致
适用条件 小样本用精确分布;\(n_1,n_2>20\) 时用正态近似效果良好
优势 对总体分布无要求,计算简单,可快速判断序列的随机性/分布一致性
局限 存在大量打结值(相同观测值)时,游程数判断受影响,需调整或更换方法

符号检验(Sign Test)知识点详解与推导

一、符号检验的核心定位与基本思想

符号检验是经典的非参数检验方法,核心用于连续总体的分位数检验(最常用为中位数检验),也是配对设计差异检验的常用非参数方法。

核心特性

  • 无分布依赖:无需对总体分布做任何强假定(如正态性),仅要求总体为连续型,适用范围极广;
  • 信息利用:仅利用样本观测值与待检验值的差值正负符号做推断,完全不依赖差值的绝对大小,因此对异常值、极端值的稳健性极强;
  • 核心逻辑:通过正号、负号的数量是否符合原假设下的概率分布,判断是否拒绝原假设。

二、基础场景:总体中位数的符号检验(例7.6.2详解)

问题设定

设连续总体\(X\)的分布函数为\(F(x)\),中位数为\(m_e\),满足\(F(m_e)=0.5\)。待检验假设为:

\[H_0: F(0)=0.5 \quad \text{vs} \quad H_1: F(0)\neq0.5 \]

即检验总体中位数为0。

步骤1:构造符号统计量

\(x_1,x_2,\cdots,x_n\)为来自总体\(X\)的样本,定义符号函数:

\[y_i = \begin{cases} 1, & x_i > 0 \\ 0, & x_i \leq 0 \end{cases}, \quad i=1,2,\cdots,n\]

记正号的总个数为符号统计量:

\[S^+ = \sum_{i=1}^n y_i \]

\(S^+\)的含义为:样本中大于0的观测值的个数。

步骤2:原假设下\(S^+\)的分布推导

\(H_0\)成立时,总体中位数为0,因此:

  • 单个样本观测值大于0的概率\(P(x_i>0)=1-F(0)=0.5\)
  • 单个样本观测值小于等于0的概率\(P(x_i\leq0)=F(0)=0.5\)

因此,每个\(y_i\)独立同服从伯努利分布\(b(1,0.5)\)(单次试验成功概率为0.5,成功即\(x_i>0\))。

\(n\)个独立伯努利试验的成功次数之和服从二项分布,因此在\(H_0\)为真时:

\[S^+ \sim b(n, 0.5) \]

步骤3:检验逻辑与拒绝域

\(H_0\)成立时,\(S^+\)的期望为\(E(S^+)=n\times0.5 = n/2\),即正号个数应在总样本量的一半附近。

  • \(S^+\)过大:说明样本中正数远多于负数,中位数大概率大于0,拒绝\(H_0\)
  • \(S^+\)过小:说明样本中负数远多于正数,中位数大概率小于0,拒绝\(H_0\)

因此双侧检验的拒绝域形式为:

\[W = \{S^+ \leq c_1\} \cup \{S^+ \geq c_2\} \]

其中临界值\(c_1,c_2\)满足:

\[P(S^+ \leq c_1) \leq \alpha/2, \quad P(S^+ \geq c_2) \leq \alpha/2 \]

\(\alpha\)为给定的显著性水平。


三、一般场景:总体\(p\)分位数的符号检验(完整推导)

1. \(p\)分位数的定义

对于连续总体\(X\),分布函数为\(F(x)\),其\(p\)分位数\(x_p\)\(0<p<1\))满足:

\[F(x_p) = P(X \leq x_p) = p \]

连续总体下,\(x_p\)存在且唯一,分布函数\(F(x)\)严格单调递增。

2. 待检验假设与等价转化

我们要检验的原假设与备择假设为:

\[H_0: x_p \leq x_0 \quad \text{vs} \quad H_1: x_p > x_0 \]

其中\(x_0\)为给定的常数。

核心等价性推导

  1. 定义符号函数与成功概率:
    对样本\(x_1,x_2,\cdots,x_n\),定义:

    \[y_i = \begin{cases} 1, & x_i > x_0 \\ 0, & x_i \leq x_0 \end{cases}, \quad i=1,2,\cdots,n\]

    记单次试验的成功概率:

    \[\theta = P(y_i=1) = P(X > x_0) = 1 - F(x_0) \]

  2. 原假设的等价转化:
    由于\(F(x)\)严格单调递增,因此:

    \[x_p \leq x_0 \iff F(x_0) \geq F(x_p) = p \]

    两边取补集得:

    \[1 - F(x_0) \leq 1 - p \iff \theta \leq 1-p \]

    反之,若\(\theta \leq 1-p\),则\(1-F(x_0)\leq1-p \implies F(x_0)\geq p=F(x_p) \implies x_0\geq x_p\),即\(H_0\)成立。

因此,原分位数检验问题完全等价于二项分布的参数检验问题

\[H_0: \theta \leq 1-p \quad \text{vs} \quad H_1: \theta > 1-p \]

3. 符号统计量的分布

\(y_1,y_2,\cdots,y_n\)独立同服从伯努利分布\(b(1,\theta)\),因此符号统计量:

\[S^+ = \sum_{i=1}^n y_i \]

服从二项分布\(b(n,\theta)\),即:

\[P(S^+=k) = \binom{n}{k} \theta^k (1-\theta)^{n-k}, \quad k=0,1,\cdots,n \]

4. 拒绝域与\(p\)值计算

对于等价的二项分布单边检验,\(S^+\)越大,说明\(\theta\)越大,越倾向于拒绝\(H_0\),因此拒绝域形式为:

\[W = \{S^+ \geq c\} \]

其中临界值\(c\)为满足下式的最小整数:

\[c = \inf\left\{ k: \sum_{i=k}^n \binom{n}{i} (1-p)^i p^{n-i} \leq \alpha \right\} \]

注:\(H_0\)\(\theta\leq1-p\),最不利情况为\(\theta=1-p\)(边界值),此时犯第一类错误的概率最大,因此用\(\theta=1-p\)计算临界值,可保证整个\(H_0\)范围内第一类错误概率不超过\(\alpha\)

\(p\)值计算

记符号统计量的观测值为\(S_0^*\),则该检验的\(p\)值为:

\[p = P(S^+ \geq S_0^* \mid \theta=1-p) = \sum_{i=S_0^*}^n b(i;n,1-p) \]

其中\(b(i;n,1-p)=\binom{n}{i}(1-p)^i p^{n-i}\)为二项分布的概率质量函数。
\(p<\alpha\),则拒绝原假设\(H_0\)


四、三种假设形式的符号检验完整总结

基于上述推导,我们可以得到分位数检验的三种完整形式,对应左侧单边、右侧单边、双侧检验,如下表所示:

原假设\(H_0\) 备择假设\(H_1\) 等价二项检验 拒绝域形式 检验的\(p\)
\(x_p \leq x_0\) \(x_p > x_0\) \(H_0:\theta\leq1-p\) vs \(H_1:\theta>1-p\) \(W_Ⅰ=\{S^+ \geq c\}\) \(\sum_{i=S_0^*}^n b(i;n,1-p)\)
\(x_p \geq x_0\) \(x_p < x_0\) \(H_0:\theta\geq1-p\) vs \(H_1:\theta<1-p\) \(W_Ⅱ=\{S^+ \leq c\}\) \(\sum_{i=0}^{S_0^*} b(i;n,1-p)\)
\(x_p = x_0\) \(x_p \neq x_0\) \(H_0:\theta=1-p\) vs \(H_1:\theta\neq1-p\) \(W_Ⅲ=\{S^+ \leq c_1 \text{ 或 } S^+ \geq c_2\}\) \(2\min\left\{ \sum_{i=0}^{S_0^*} b(i;n,1-p), \sum_{i=S_0^*}^n b(i;n,1-p), 0.5 \right\}\)

补充说明

  1. 左侧单边检验的推导逻辑:\(x_p\geq x_0 \implies F(x_0)\leq p \implies \theta=1-F(x_0)\geq1-p\)\(S^+\)越小越拒绝\(H_0\)
  2. 双侧检验的\(p\)值取单侧\(p\)值的2倍,同时与0.5取最小值,避免\(p\)值超过1(当\(S_0^*\)接近\(n/2\)时,单侧\(p\)值可能大于0.5,此时\(p\)值最大为1)。

五、大样本正态近似

当样本量\(n\)较大时(通常要求\(np\geq5\)\(n(1-p)\geq5\)),根据中心极限定理,二项分布\(b(n,\theta)\)可近似为正态分布:

\[S^+ \stackrel{近似}{\sim} N\left( n\theta, n\theta(1-\theta) \right) \]

\(H_0\)成立时,\(\theta=1-p\),因此构造标准化检验统计量:

\[Z = \frac{S^+ - n(1-p)}{\sqrt{np(1-p)}} \stackrel{近似}{\sim} N(0,1) \]

连续性修正

由于二项分布是离散分布,正态分布是连续分布,为提高近似精度,需进行连续性修正:

  • 右侧单边检验(\(S^+\geq c\)):修正为\(Z = \frac{S^+ - 0.5 - n(1-p)}{\sqrt{np(1-p)}}\),拒绝域\(Z\geq z_\alpha\)
  • 左侧单边检验(\(S^+\leq c\)):修正为\(Z = \frac{S^+ + 0.5 - n(1-p)}{\sqrt{np(1-p)}}\),拒绝域\(Z\leq -z_\alpha\)
  • 双侧检验:拒绝域\(|Z|\geq z_{\alpha/2}\)

其中\(z_\alpha\)为标准正态分布的上\(\alpha\)分位数。


六、符号检验的经典应用:配对样本差异检验

符号检验最常用的场景之一,是配对设计的非参数差异检验,作为配对t检验的替代方法(当配对差值不满足正态性时)。

问题设定

配对设计样本:\((x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)\),其中\(x_i\)为处理A的观测值,\(y_i\)为处理B的观测值,差值\(d_i = x_i - y_i\)
待检验假设:两个处理的效应无差异,即差值\(d_i\)的中位数为0,对应:

\[H_0: m_d=0 \quad \text{vs} \quad H_1: m_d\neq0 \]

检验步骤

  1. 计算配对差值\(d_i=x_i-y_i\)
  2. 定义符号函数:\(y_i=1\)\(d_i>0\)\(y_i=0\)\(d_i\leq0\),统计正号个数\(S^+\)
  3. 此时\(p=0.5\),对应中位数检验,\(H_0\)\(S^+\sim b(n,0.5)\)
  4. 按双侧检验计算临界值或\(p\)值,做出决策。

七、符号检验的优缺点与适用条件

适用条件

  1. 总体为连续型(保证打结值\(x_i=x_0\)的概率为0);
  2. 待检验目标为总体分位数(尤其是中位数),或配对样本的效应差异;
  3. 总体分布未知、不满足参数检验的正态性假定,或存在极端异常值。

优势

  1. 无分布依赖,适用范围极广,不受总体分布形式的限制;
  2. 稳健性极强,仅利用符号信息,完全不受极端异常值的影响;
  3. 计算简单,逻辑直观,易于理解和实现;
  4. 可用于有序分类数据(仅能比较大小、无法计算数值差异的等级数据)。

局限

  1. 信息利用率低:完全丢弃了差值的大小信息,当总体满足正态性时,检验效能远低于配对t检验等参数方法;
  2. 打结值敏感:当存在大量\(x_i=x_0\)(差值为0)的打结情况时,样本量被压缩,检验效能大幅下降,此时更推荐使用Wilcoxon符号秩检验;
  3. 小样本下,二项分布的临界值可能无法恰好满足显著性水平\(\alpha\)的要求,检验的实际显著性水平会低于名义水平。

八、符号检验核心知识点归纳总表

分类 核心内容
方法定位 经典非参数检验方法,核心用于连续总体的分位数检验、配对样本差异检验
核心原理 利用样本与待检验值差值的正负符号数量,通过二项分布做统计推断,不依赖总体分布
核心统计量 符号统计量\(S^+\):样本中大于待检验值\(x_0\)的观测值个数,服从二项分布\(b(n,\theta)\)
检验前提 总体为连续型,保证分位数唯一、打结值概率为0
小样本检验 基于二项分布精确计算临界值或\(p\)值,分单边、双侧检验
大样本检验 基于中心极限定理做正态近似,需进行连续性修正,构造Z统计量
经典应用 1. 总体中位数检验;2. 配对设计的效应差异检验(配对t检验的非参数替代)
核心优势 无分布依赖、稳健性极强(抗异常值)、计算简单、适用有序分类数据
核心局限 丢弃数值大小信息,检验效能低于参数方法;对大量打结值敏感
决策规则 \(p\)值小于显著性水平\(\alpha\)时,拒绝原假设\(H_0\);否则不拒绝\(H_0\)

符号检验例题详解(含完整推导、计算与原理对应)

一、例7.6.3 总体分位数的左侧单边符号检验

1. 问题背景与检验假设

  • 业务背景:以往资料显示,该种圆钢90%的产品硬度不小于103 kg/mm²,即10%分位数\(x_{0.10}=103\)(10%分位数的定义:总体中10%的观测值≤\(x_{0.10}\),90%的观测值≥\(x_{0.10}\))。现抽取20根样本,检验该结论是否仍成立。
  • 统计假设:

    \[H_0: x_{0.10} \geq 103 \quad \text{vs} \quad H_1: x_{0.10} < 103 \]

    显著性水平\(\alpha=0.05\)

2. 原理对应(结合符号检验核心理论)

根据\(p\)分位数的定义,\(F(x_{0.10})=P(X \leq x_{0.10})=0.1\),原假设\(H_0: x_{0.10} \geq 103\)等价于:

\[F(103) \leq F(x_{0.10}) = 0.1 \]

定义符号统计量的成功概率:

\[\theta = P(X > 103) = 1 - F(103) \]

因此原假设可等价转化为二项分布参数检验:

\[H_0: \theta \geq 1-0.1=0.9 \quad \text{vs} \quad H_1: \theta < 0.9 \]

  • 符号统计量\(S^+\):样本中硬度大于103的观测值个数(即差值\(x_i-103>0\)的正号个数);
  • \(H_0\)成立时,\(S^+\)服从二项分布\(b(n, 0.9)\),其中样本量\(n=20\)
  • 拒绝域逻辑:\(S^+\)越小,说明\(\theta\)越小,越倾向于拒绝\(H_0\),因此拒绝域为\(\{S^+ \leq c\}\)

3. 详细解题步骤

步骤1:计算差值,构造符号序列

对每个样本硬度\(x_i\),计算差值\(z_i = x_i - 103\),结果如下:

样本序号 1 2 3 4 5 6 7 8 9 10
硬度\(x_i\) 142 134 119 98 131 102 154 122 93 137
差值\(z_i\) 39 31 16 -5 28 -1 51 19 -10 34
符号 + + + - + - + + - +
样本序号 11 12 13 14 15 16 17 18 19 20
硬度\(x_i\) 86 119 161 144 158 165 81 117 128 113
差值\(z_i\) -17 16 58 41 55 62 -22 14 25 10
符号 - + + + + + - + + +

步骤2:统计符号统计量的观测值

统计正号(\(z_i>0\))的个数,得\(S_0^+ = 15\)

步骤3:计算检验的\(p\)

左侧单边检验的\(p\)值为:\(H_0\)成立时,\(S^+\)小于等于观测值15的累积概率,即

\[p = P(S^+ \leq 15 \mid S^+ \sim b(20, 0.9)) = \sum_{i=0}^{15} \binom{20}{i} 0.9^i 0.1^{20-i} \]

二项分布概率计算:

  • 二项分布\(b(20,0.9)\)的累积概率,\(P(S^+ \leq15) = 1 - P(S^+ \geq16)\)
  • \(P(S^+ \geq16) = \sum_{i=16}^{20}\binom{20}{i}0.9^i0.1^{20-i} \approx 0.957\)
  • 因此\(P(S^+ \leq15) = 1 - 0.957 = 0.043\)

步骤4:决策与结论

\(p=0.043 < \alpha=0.05\),因此拒绝原假设\(H_0\),不能认为该种圆钢的10%分位数\(x_{0.10}\)不小于103 kg/mm²,即原“90%产品硬度不小于103”的结论不成立。

4. 关键注意点

  • 本题为左侧单边检验,拒绝域为\(S^+\)偏小的区域,\(p\)值为左侧累积概率;
  • 原假设的边界值为\(\theta=0.9\),因此用二项分布\(b(20,0.9)\)计算概率,保证第一类错误概率不超过\(\alpha\)
  • \(p\)值大于\(\alpha\),则不拒绝原假设,仅说明没有足够证据推翻原结论,而非证明原结论成立。

二、例7.6.4 配对样本的双侧符号检验

1. 问题背景与检验假设

  • 业务背景:工厂两个化验室每天同时从冷却水中取样,测量含氯量,共11组配对数据,检验两个化验室的测定结果是否存在显著性差异。
  • 统计假设:
    记化验室A的测量误差分布为\(F(x)\),化验室B的为\(G(x)\),检验

    \[H_0: F(x) = G(x) \quad \text{vs} \quad H_1: F(x) \neq G(x) \]

    显著性水平\(\alpha=0.05\)

2. 配对设计的处理逻辑

配对数据的核心问题:每天的含氯量本身存在差异,因此\(x_i\)(化验室A)和\(y_i\)(化验室B)的差异,既包含化验室的系统误差,也包含当天含氯量的真实值差异。

通过配对差值消除真实值的影响:
\(x_i = \mu_i + \xi_i\)\(y_i = \mu_i + \eta_i\),其中\(\mu_i\)为第\(i\)天冷却水的真实含氯量,\(\xi_i\)\(\eta_i\)为两个化验室的测量误差。
差值\(z_i = x_i - y_i = \xi_i - \eta_i\),完全消除了\(\mu_i\)的影响,仅保留两个化验室的误差差异。

\(H_0\)成立时,\(\xi_i\)\(\eta_i\)同分布,因此\(z_i = \xi_i - \eta_i\)的分布关于0对称,即\(P(z_i>0)=P(z_i<0)=0.5\),差值的中位数为0,可使用双侧符号检验

3. 详细解题步骤

步骤1:计算配对差值,统计符号

根据表格数据,计算差值\(z_i=x_i-y_i\),并统计正负号:

序号\(i\) 1 2 3 4 5 6 7 8 9 10 11
差值\(z_i\) 0.03 -0.04 -0.16 0.01 -0.06 -0.05 -0.02 -0.1 -0.11 -0.07 -0.12
符号 + - - + - - - - - - -

步骤2:统计符号统计量的观测值

统计正号(\(z_i>0\))的个数,得\(S_0^+ = 2\),无差值为0的打结值,样本量\(n=11\)

步骤3:计算检验的\(p\)

\(H_0\)成立时,\(S^+ \sim b(11, 0.5)\),双侧检验的\(p\)值为:

\[p = 2\min\left\{ P(S^+ \leq 2), P(S^+ \geq 2) \right\} \]

二项分布概率计算:

  • 左侧累积概率:\(P(S^+ \leq 2) = \sum_{i=0}^{2} \binom{11}{i} 0.5^{11}\)
    计算得:\(\binom{11}{0}0.5^{11} + \binom{11}{1}0.5^{11} + \binom{11}{2}0.5^{11} = (1+11+55)/2048 = 67/2048 \approx 0.0327\)
  • 右侧累积概率:\(P(S^+ \geq 2) = 1 - P(S^+ \leq1) \approx 0.994\)
  • 取最小值乘以2,得\(p=2\times0.0327 = 0.0654\)

步骤4:决策与结论

\(p=0.0654 > \alpha=0.05\),因此不拒绝原假设\(H_0\),在0.05的显著性水平下,没有足够证据表明两个化验室的测定结果存在显著性差异。

4. 关键注意点

  • 本题为双侧检验\(p\)值取单侧最小累积概率的2倍,避免\(p\)值超过1;
  • 配对符号检验的核心是通过差值消除配对个体的固有差异,仅关注处理/组间的差异,是配对t检验的非参数替代方法,适用于差值不满足正态性的场景;
  • 若存在差值为0的打结值,通常的处理方式是剔除打结值,样本量\(n\)相应减少;
  • 本题\(p=0.0654\)接近0.05,若放宽显著性水平至\(\alpha=0.1\),则会拒绝原假设,说明检验结果对显著性水平敏感,本质是符号检验的信息利用率低,检验效能弱于配对t检验。

三、两个例题的核心对比总结

对比维度 例7.6.3 分位数单边检验 例7.6.4 配对样本双侧检验
检验目标 检验总体10%分位数是否≥103 检验两个配对总体的分布是否相同
假设类型 左侧单边检验 双侧检验
符号统计量\(S^+\) 样本值大于103的正号个数 配对差值为正的正号个数
\(H_0\)下的分布 \(b(20, 0.9)\) \(b(11, 0.5)\)
\(p\)值计算 左侧累积概率\(P(S^+ \leq 15)\) 2倍最小单侧累积概率
决策结果 \(p<0.05\),拒绝\(H_0\) \(p>0.05\),不拒绝\(H_0\)
核心应用场景 总体分位数的检验 配对设计的组间差异检验

Wilcoxon秩和检验知识点详解与完整推导

一、秩和检验的核心定位

符号检验仅利用了观测值与中心位置差值的正负符号,完全丢弃了差值的大小信息,检验效能较低。Wilcoxon秩和检验(秩检验)由威尔科克森1945年提出,是经典的非参数检验方法,它同时结合了差值的符号绝对值大小,充分利用样本信息,检验效能显著高于符号检验,且仍不依赖总体分布的正态性假定,适用范围极广。

秩和检验主要分为两大核心应用:

  1. 单样本/配对样本Wilcoxon符号秩检验:用于对称总体的中心位置检验(如配对设计的组间差异检验);
  2. 两独立样本Wilcoxon秩和检验(Mann-Whitney U检验):用于两个独立总体的位置差异检验,是两独立样本t检验的非参数替代方法。

二、基础概念:秩与秩统计量

1. 秩的定义

定义7.6.1\(x_1,x_2,\cdots,x_n\)是来自连续分布\(F(x)\)的简单随机样本,将观测值从小到大排序得到有序样本\(x_{(1)} \leq x_{(2)} \leq \cdots \leq x_{(n)}\),观测值\(x_i\)在有序样本中的序号\(r\)称为\(x_i\),记为\(R_i=r\)

核心说明:连续总体中,观测值相等(打结)的概率为0,因此每个观测值的秩唯一确定。
例7.6.5 设\(n=6\),观测值为\(196,224,171,241,162,193\),从小到大排序为\(162,171,193,196,224,241\),对应秩为\(1,2,3,4,5,6\),因此原观测值的秩依次为\(4,5,2,6,1,3\)

2. 秩统计量

定义7.6.2\(x_1,x_2,\cdots,x_n\)是来自连续总体的样本,\(R_i\)\(x_i\)的秩,称向量\(R=(R_1,R_2,\cdots,R_n)\)为样本的秩统计量,基于秩统计量构造的检验方法统称为秩检验


三、单样本/配对样本Wilcoxon符号秩检验

1. 检验场景与假设

符号秩检验适用于对称连续总体的中心位置检验,最典型的场景是配对设计的组间差异检验:

  • 配对样本\((x_i,y_i)\),差值\(z_i=x_i-y_i\),检验两个总体的分布是否相同,等价于检验差值\(z_i\)的分布关于0对称,即总体中位数为0。
  • 原假设与备择假设:

    \[H_0: \theta=0 \quad \text{vs} \quad H_1: \theta \neq 0 \]

    其中\(\theta\)为总体的对称中心(中位数)。

2. 符号秩统计量的定义

定义7.6.3\(x_1,x_2,\cdots,x_n\)是样本,记\(R_i\)\(|x_i|\)\((|x_1|,|x_2|,\cdots,|x_n|)\)中的秩,定义指示函数:

\[I(x_i>0) = \begin{cases} 1, & x_i>0 \\ 0, & x_i \leq 0 \end{cases}\]

符号秩和统计量

\[W^+ = \sum_{i=1}^n R_i \cdot I(x_i>0) \]

\(W^+\)的含义为:所有正观测值的秩的总和。

核心逻辑:\(H_0\)成立时,总体关于0对称,正、负观测值的数量应接近,且绝对值的秩应均匀分布,\(W^+\)应接近总秩和的一半;若\(W^+\)过大或过小,说明正/负观测值的绝对值显著偏大,拒绝\(H_0\)

3. 符号秩统计量的分布特性与推导

核心前提(\(H_0\)成立时)

  1. 总体关于0对称,因此\(P(x_i>0)=P(x_i<0)=0.5\),每个观测值的符号与绝对值的秩相互独立;
  2. 所有秩\(1,2,\cdots,n\)等可能地分配给正、负观测值,每个秩被计入\(W^+\)的概率为0.5,且相互独立。

期望\(E(W^+)\)的推导

\(W^+\)拆解为秩的加权和:\(W^+ = 1\cdot I_1 + 2\cdot I_2 + \cdots + n\cdot I_n\),其中\(I_k\)为指示变量,代表秩为\(k\)的观测值为正,\(P(I_k=1)=0.5\)

根据期望的线性性质:

\[E(W^+) = \sum_{k=1}^n k \cdot E(I_k) = 0.5 \cdot \sum_{k=1}^n k = 0.5 \cdot \frac{n(n+1)}{2} = \frac{n(n+1)}{4} \]

方差\(Var(W^+)\)的推导

由于\(I_1,\cdots,I_n\)相互独立,协方差为0,因此:

\[Var(W^+) = \sum_{k=1}^n Var(k\cdot I_k) = \sum_{k=1}^n k^2 \cdot Var(I_k) \]

其中\(Var(I_k)=0.5\times0.5=0.25\),且\(\sum_{k=1}^n k^2 = \frac{n(n+1)(2n+1)}{6}\),代入得:

\[Var(W^+) = 0.25 \cdot \frac{n(n+1)(2n+1)}{6} = \frac{n(n+1)(2n+1)}{24} \]

总秩和关系

正号秩和\(W^+\)与负号秩和\(W^-\)满足:

\[W^+ + W^- = 1+2+\cdots+n = \frac{n(n+1)}{2} \]

因此\(W^- = \frac{n(n+1)}{2} - W^+\),二者完全线性相关,检验时仅需计算\(W^+\)即可。

4. 检验拒绝域与实施步骤

小样本检验(\(n\leq50\)

查Wilcoxon符号秩检验临界值表,得临界值\(W_{\alpha/2}(n)\)\(W_{1-\alpha/2}(n)\),其中\(W_{1-\alpha/2}(n) = \frac{n(n+1)}{2} - W_{\alpha/2}(n)\)

  • 双侧检验拒绝域:\(\{W^+ \leq W_{\alpha/2}(n)\} \cup \{W^+ \geq W_{1-\alpha/2}(n)\}\)
  • 左侧单侧检验(\(H_1:\theta<0\))拒绝域:\(\{W^+ \leq W_{\alpha}(n)\}\)
  • 右侧单侧检验(\(H_1:\theta>0\))拒绝域:\(\{W^+ \geq W_{1-\alpha}(n)\}\)

大样本近似(\(n>50\)

根据中心极限定理,\(H_0\)成立时\(W^+\)近似服从正态分布,构造标准化检验统计量:

\[Z = \frac{W^+ - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}} \stackrel{近似}{\sim} N(0,1) \]

若存在打结(相同绝对值),需对分母进行修正,修正公式为:

\[Var(W^+) = \frac{n(n+1)(2n+1) - 0.5\sum_{j=1}^g (t_j^3 - t_j)}{24} \]

其中\(g\)为结的个数,\(t_j\)为第\(j\)个结的长度(相同绝对值的个数)。

5. 例题7.6.6 完整详解(配对样本符号秩检验)

问题背景

两个化验室每天同步测量冷却水含氯量,共11组配对数据,检验两个化验室的测定结果是否存在显著差异,\(\alpha=0.05\)

检验步骤

  1. 计算配对差值\(z_i = x_i(\text{化验室A}) - y_i(\text{化验室B})\),结果如下:

    \(i\) 1 2 3 4 5 6 7 8 9 10 11
    \(z_i\) 0.03 -0.04 -0.16 0.01 -0.06 -0.05 -0.02 -0.1 -0.11 -0.07 -0.12
  2. 计算绝对值与秩:对\(|z_i|\)从小到大排序,赋予秩:
    | \(|z_i|\) | 0.03 | 0.04 | 0.16 | 0.01 | 0.06 | 0.05 | 0.02 | 0.1 | 0.11 | 0.07 | 0.12 |
    |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |
    | 秩\(R_i\) | 3 | 4 | 11 | 1 | 6 | 5 | 2 | 8 | 9 | 7 | 10 |

  3. 计算符号秩和统计量:正差值的秩为3和1,因此\(W^+ = 3+1=4\)

  4. 确定拒绝域与决策
    查临界值表得\(W_{0.025}(11)=10\)\(W_{0.975}(11)=\frac{11\times12}{2}-10=56\),拒绝域为\(\{W^+\leq10\}\cup\{W^+\geq56\}\)
    观测值\(W^+=4\leq10\),落在拒绝域内,因此拒绝原假设\(H_0\),认为两个化验室的测定结果存在显著差异。

与符号检验的对比

符号检验中,正号个数为2,\(p\)值为0.0654,在\(\alpha=0.05\)下不拒绝原假设;而符号秩检验利用了差值的大小信息,两个正差值的绝对值极小、秩极低,更能反映系统差异,检验效能显著更高。


四、两独立样本Wilcoxon秩和检验

1. 检验场景与假设

两独立样本秩和检验用于两个独立连续总体的位置差异检验,是两独立样本t检验的非参数替代方法,适用于数据不满足正态性、存在异常值的场景。

设两个独立总体的分布函数为\(F(x-\theta_1)\)\(F(x-\theta_2)\)(分布形状相同,仅位置参数\(\theta\)不同),待检验的三类假设为:

类型 原假设\(H_0\) 备择假设\(H_1\)
右侧单侧 \(\theta_1 \leq \theta_2\) \(\theta_1 > \theta_2\)
左侧单侧 \(\theta_1 \geq \theta_2\) \(\theta_1 < \theta_2\)
双侧 \(\theta_1 = \theta_2\) \(\theta_1 \neq \theta_2\)

2. 秩和统计量的定义

\(x_1,x_2,\cdots,x_n\)是来自总体1的样本,\(y_1,y_2,\cdots,y_m\)是来自总体2的样本,将两组样本合并后从小到大排序,给每个观测值赋予秩\(1,2,\cdots,N\)\(N=m+n\))。

\(R_i\)为样本\(y_i\)在合并样本中的秩,定义Wilcoxon秩和统计量

\[W = \sum_{i=1}^m R_i \]

即第二组样本的秩的总和。

核心逻辑:\(H_0\)成立时,两个总体分布相同,两组样本的秩应均匀分布在\(1\)\(N\)之间,\(W\)应接近理论期望;若\(W\)显著偏小/偏大,说明两组样本的位置存在显著差异,拒绝\(H_0\)

3. 秩和统计量的分布特性与推导

核心前提(\(H_0\)成立时)

两个样本来自同一总体,因此\(m\)\(y\)的秩是从\(1\)\(N\)中随机抽取\(m\)个不同的数,所有组合等可能。

期望\(E(W)\)的推导

\(W\)拆解为:\(W = \sum_{k=1}^N k\cdot I_k\),其中\(I_k\)为指示变量,代表秩\(k\)被选入\(y\)的秩中,\(P(I_k=1)=\frac{m}{N}\)

根据期望的线性性质:

\[E(W) = \sum_{k=1}^N k\cdot E(I_k) = \frac{m}{N} \cdot \frac{N(N+1)}{2} = \frac{m(m+n+1)}{2} \]

方差\(Var(W)\)的推导

通过指示变量的协方差化简,最终可得:

\[Var(W) = \frac{mn(m+n+1)}{12} \]

推导过程详见附录,核心结论与教材完全一致。

总秩和关系

两组样本的秩和满足:

\[W_x + W_y = \frac{N(N+1)}{2} = \frac{(m+n)(m+n+1)}{2} \]

因此用任意一组的秩和做检验,结果完全等价。

4. 检验拒绝域与实施步骤

小样本检验(\(m,n\leq20\)

查Wilcoxon两样本秩和检验临界值表,得临界值\(W_{\alpha}(m,n)\),其中\(W_{1-\alpha}(m,n) = m(m+n+1) - W_{\alpha}(m,n)\)

  • 左侧单侧检验(\(H_1:\theta_1>\theta_2\)\(y\)的位置偏小)拒绝域:\(\{W \leq W_{\alpha}(m,n)\}\)
  • 右侧单侧检验拒绝域:\(\{W \geq W_{1-\alpha}(m,n)\}\)
  • 双侧检验拒绝域:\(\{W \leq W_{\alpha/2}(m,n)\} \cup \{W \geq W_{1-\alpha/2}(m,n)\}\)

大样本近似(\(m,n\geq20\)

根据中心极限定理,\(H_0\)成立时\(W\)近似服从正态分布,构造标准化检验统计量:

\[Z = \frac{W - \frac{m(m+n+1)}{2}}{\sqrt{\frac{mn(m+n+1)}{12}}} \stackrel{近似}{\sim} N(0,1) \]

若存在打结,需对方差进行修正:

\[Var(W) = \frac{mn(N+1)}{12} \cdot \left[1 - \frac{\sum_{j=1}^g (t_j^3 - t_j)}{N^3 - N}\right] \]

其中\(N=m+n\)\(g\)为结的个数,\(t_j\)为第\(j\)个结的长度。

5. 例题7.6.7 完整详解(两独立样本秩和检验)

问题背景

对羊毛进行处理前后的含脂率检测,处理前样本量\(n=6\),处理后样本量\(m=5\),检验处理后含脂率是否显著下降,\(\alpha=0.05\)

  • 处理前:\(0.20, 0.24, 0.66, 0.42, 0.12, 0.25\)
  • 处理后:\(0.13, 0.07, 0.21, 0.08, 0.19\)
  • 检验假设:\(H_0:\theta_1=\theta_2\) vs \(H_1:\theta_1>\theta_2\)(处理后含脂率下降)

检验步骤

  1. 合并排序与赋秩:将两组样本合并后从小到大排序,标记处理后样本(\(y\))并赋予秩:

    合并样本 0.07 0.08 0.12 0.13 0.19 0.20 0.21 0.24 0.25 0.42 0.66
    组别 处理后 处理后 处理前 处理后 处理后 处理前 处理后 处理前 处理前 处理前 处理前
    1 2 3 4 5 6 7 8 9 10 11
  2. 计算秩和统计量:处理后样本的秩为\(1,2,4,5,7\),因此\(W=1+2+4+5+7=19\)

  3. 确定拒绝域与决策
    查临界值表得\(W_{0.05}(5,6)=20\),拒绝域为\(\{W\leq20\}\)
    观测值\(W=19\leq20\),落在拒绝域内,因此拒绝原假设\(H_0\),认为处理后的羊毛含脂率显著下降。


五、秩和检验的关键补充说明

  1. 打结值的处理:当存在相同观测值(结)时,对相同观测值赋予平均秩,同时对方差进行修正,避免检验结果偏倚。
  2. 单侧检验的适配:符号秩检验和两样本秩和检验均可适配单侧检验,仅需调整拒绝域的方向,核心逻辑不变。
  3. 适用范围拓展:秩和检验不仅适用于连续型数值数据,也可用于有序分类数据(等级数据),这是参数t检验无法实现的。
  4. 检验效能:当总体满足正态性时,秩和检验的检验效能略低于t检验;当总体不满足正态性、存在异常值时,秩和检验的检验效能远高于t检验,稳健性极强。

六、核心非参数检验方法归纳总结表

检验方法 核心适用场景 检验统计量 原假设下的分布 期望 方差 核心优势 核心局限
符号检验 单样本分位数检验、配对样本差异检验 正号个数\(S^+\) 二项分布\(b(n,p)\) \(np\) \(np(1-p)\) 无分布依赖、计算极简、抗极端值 丢弃数值大小信息,检验效能最低
Wilcoxon符号秩检验 对称总体中心位置检验、配对样本差异检验 正号秩和\(W^+\) 符号秩分布 \(\frac{n(n+1)}{4}\) \(\frac{n(n+1)(2n+1)}{24}\) 结合符号与数值大小,检验效能高、稳健性强 要求总体分布对称,大量打结时效能下降
Wilcoxon两样本秩和检验 两独立总体的位置差异检验 样本秩和\(W\) 秩和分布 \(\frac{m(m+n+1)}{2}\) \(\frac{mn(m+n+1)}{12}\) 不要求正态性,适配有序分类数据,是t检验的最优非参数替代 要求两总体分布形状相同,大量打结时需修正

posted on 2026-03-21 14:45  Indian_Mysore  阅读(10)  评论(0)    收藏  举报

导航