夫君子之行，静以修身，俭以养德；非澹泊无以明志，非宁静无以致远。夫学须静也，才须学也；非学无以广才，非志无以成学。怠慢则不能励精，险躁则不能冶性。年与时驰，意与岁去，遂成枯落，多不接世。悲守穷庐，将复何及！

非参数检验

游程检验（Run Test）知识点详解与推导

一、非参数检验与游程检验的定位

参数检验依赖总体分布的强假定（如正态分布），当总体分布未知、假定不满足时，推断结果会出现偏差。非参数检验仅对总体做极弱的分布假定，适用性更广、稳健性更强。

游程检验是经典的非参数检验方法，核心有两大应用场景：

检验单样本序列的随机性（统计推断的核心前提）；
检验两个独立样本是否来自同分布总体。

二、基础概念定义

1. 0-1序列变换

设按顺序得到的样本观测序列为 \(x_1,x_2,\cdots,x_n\)，计算样本中位数 \(m_e\)：

小于 \(m_e\) 的 \(x_i\) 替换为0；
大于或等于 \(m_e\) 的 \(x_i\) 替换为1；
最终得到仅由0、1构成的二元序列，记0的个数为 \(n_1\)，1的个数为 \(n_2\)，总样本量 \(n=n_1+n_2\)。

注：选择中位数做变换，可保证0和1的数量尽可能均衡，避免极端占比影响游程判断，且中位数不受极端值干扰，稳健性优于均值。

2. 游程与总游程数

0游程：以1为边界的连续一串0，称为1个0游程；
1游程：以0为边界的连续一串1，称为1个1游程；
总游程数 \(R\)：0游程个数 + 1游程个数，即序列中连续相同数字的段数总和。

示例：序列 0 1 0 1 1 1 0 1 1 0 1 0 0

0游程共5个，1游程共4个，总游程数 \(R=5+4=9\)。

3. 游程数的随机性逻辑

随机序列的游程数应“适中”：

\(R\) 过小：0/1出现聚集（如前半段全0、后半段全1），说明序列存在趋势性，非随机；
\(R\) 过大：0/1交替过于频繁（如010101…），说明序列存在周期性，非随机。

三、原假设下总游程数 \(R\) 的精确分布推导

前提设定

原假设 \(H_0\)：序列是随机的。此时所有0和1的排列是等可能的，总排列数为 \(\binom{n_1+n_2}{n_1}\)（从 \(n\) 个位置中选 \(n_1\) 个放0，剩余放1）。

游程的核心特性：0游程和1游程必然交替出现，因此：

当 \(R=2k\)（偶数）：0游程数 = 1游程数 = \(k\)；
当 \(R=2k+1\)（奇数）：两种游程数相差1，要么0游程 \(k\) 个、1游程 \(k+1\) 个，要么反之。

1. 隔板法基础：分游程的组合数

将 \(n_1\) 个不可区分的0分成 \(k\) 个非空连续组（对应 \(k\) 个0游程），等价于在 \(n_1\) 个0的 \(n_1-1\) 个空隙中插入 \(k-1\) 个隔板，分法数为 \(\binom{n_1-1}{k-1}\)。
同理，\(n_2\) 个1分成 \(k\) 个非空游程的分法数为 \(\binom{n_2-1}{k-1}\)。

2. 情况1：\(R=2k\)（偶数）的概率分布

\(R=2k\) 意味着0、1游程各 \(k\) 个，交替排列有两种可能：

以0游程开头、1游程结尾；
以1游程开头、0游程结尾。

两种情况的排列数均为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\)，总符合条件的排列数为 \(2\binom{n_1-1}{k-1}\binom{n_2-1}{k-1}\)。

因此概率为：

\[P(R=2k) = \frac{2 \binom{n_1 - 1}{k - 1} \binom{n_2 - 1}{k - 1}}{\binom{n_1 + n_2}{n_1}}, \quad k=1,2,\cdots,\left\lfloor \frac{n}{2} \right\rfloor \]

其中 \(\lfloor \cdot \rfloor\) 为向下取整。

3. 情况2：\(R=2k+1\)（奇数）的概率分布

\(R=2k+1\) 分两个子情况：

0游程 \(k\) 个、1游程 \(k+1\) 个：序列首尾均为1，排列数为 \(\binom{n_1-1}{k-1}\binom{n_2-1}{k}\)；
0游程 \(k+1\) 个、1游程 \(k\) 个：序列首尾均为0，排列数为 \(\binom{n_1-1}{k}\binom{n_2-1}{k-1}\)。

总符合条件的排列数为两者之和，因此概率为：

\[P(R=2k+1) = \frac{\binom{n_1 - 1}{k - 1}\binom{n_2 - 1}{k} + \binom{n_1 - 1}{k}\binom{n_2 - 1}{k - 1}}{\binom{n_1 + n_2}{n_1}}, \quad k=1,2,\cdots,\left\lfloor \frac{n-1}{2} \right\rfloor \]

四、游程检验的期望与方差推导

为实现大样本正态近似，我们先推导 \(H_0\) 下 \(R\) 的期望与方差。

1. 游程数的示性函数分解

总游程数可分解为：第一个元素必然是1个游程的起点，后续每一个与前一个元素不同的位置，都会新增1个游程。定义示性函数：

\[I_i = \begin{cases} 1, & x_i \neq x_{i-1}, \quad i=2,3,\cdots,n \\ 0, & x_i = x_{i-1} \end{cases} \]

则总游程数可表示为：

\[R = 1 + \sum_{i=2}^n I_i \]

2. 期望 \(E(R)\) 推导

根据期望的线性性质：

\[E(R) = 1 + \sum_{i=2}^n E(I_i) \]

其中 \(E(I_i) = P(x_i \neq x_{i-1})\)，随机序列中相邻位置一0一1的概率为：

\[P(x_i \neq x_{i-1}) = \frac{2n_1n_2}{n(n-1)} \]

求和项共 \(n-1\) 个 \(I_i\)，因此：

\[E(R) = 1 + (n-1)\cdot\frac{2n_1n_2}{n(n-1)} = 1 + \frac{2n_1n_2}{n} \]

3. 方差 \(D(R)\) 推导

方差满足 \(D(R) = D\left(\sum_{i=2}^n I_i\right)\)，结合示性函数的协方差特性（仅相邻 \(I_i\) 有协方差，不相邻的协方差为0），最终化简得到：

\[D(R) = \frac{2n_1n_2(2n_1n_2 - n)}{n^2(n-1)} \]

五、游程检验的两类应用与实施步骤

应用1：单样本序列的随机性检验

检验假设

\(H_0\)：样本序列是随机的；\(H_1\)：样本序列非随机。

小样本检验步骤（\(n_1,n_2 \leq 20\)）

计算样本中位数，构造0-1序列，统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\)；
给定显著性水平 \(\alpha\)，查游程检验临界值表，得下临界值 \(c_1\)、上临界值 \(c_2\)，满足 \(P(R\leq c_1)\leq\alpha/2\)，\(P(R\geq c_2)\leq\alpha/2\)；
决策：若 \(R_{obs}\leq c_1\) 或 \(R_{obs}\geq c_2\)，拒绝 \(H_0\)；否则不拒绝 \(H_0\)。

也可通过p值决策：\(p=2\min\{P(R\leq R_{obs}),P(R\geq R_{obs})\}\)，若 \(p<\alpha\) 拒绝 \(H_0\)。

大样本近似检验（\(n_1,n_2 > 20\)）

当样本量较大时，根据中心极限定理，\(R\) 近似服从正态分布，构造标准化检验统计量：

\[Z = \frac{R - E(R)}{\sqrt{D(R)}} \stackrel{近似}{\sim} N(0,1) \]

拒绝域为 \(|Z| \geq z_{\alpha/2}\)（\(z_{\alpha/2}\) 为标准正态分布上 \(\alpha/2\) 分位数），若满足则拒绝 \(H_0\)。

应用2：两总体同分布检验

检验假设

\(H_0\)：两个总体的分布完全相同；\(H_1\)：两个总体的分布不同。

检验逻辑

若 \(H_0\) 为真，两样本来自同一总体，合并排序后0、1应均匀混合，游程数 \(R\) 较大；若 \(H_0\) 不真，两样本会出现聚集，游程数 \(R\) 显著偏小。因此该检验为单侧检验，拒绝域为 \(\{R\leq c\}\)。

实施步骤

将两个独立样本合并，从小到大排序，来自总体X的观测值记为0，来自总体Y的记为1，得到0-1序列；
统计 \(n_1,n_2\) 和观测游程数 \(R_{obs}\)；
小样本查临界值表，大样本用正态近似计算Z统计量，拒绝域为 \(Z \leq -z_{\alpha}\)；
决策：若满足拒绝域条件，拒绝 \(H_0\)，认为两总体分布不同；否则不拒绝 \(H_0\)。

六、游程检验核心知识点归纳总结

分类	核心内容
方法定位	非参数检验方法，不依赖总体分布形式，稳健性强
核心用途	1. 单样本序列的随机性检验；2. 两独立样本的同分布检验
基础定义	游程：连续相同的0/1构成的段；总游程数R=0游程数+1游程数
分布特性	小样本下有精确分布，分R为偶数/奇数两种情况推导；大样本下渐近正态分布
期望与方差	\(E(R)=1+\frac{2n_1n_2}{n}\)；\(D(R)=\frac{2n_1n_2(2n_1n_2-n)}{n^2(n-1)}\)
随机性检验	双侧检验，拒绝域 \(\{R\leq c_1\}\cup\{R\geq c_2\}\)，检验序列是否随机
两总体同分布检验	单侧检验，拒绝域 \(\{R\leq c\}\)，检验两总体分布是否一致
适用条件	小样本用精确分布；\(n_1,n_2>20\) 时用正态近似效果良好
优势	对总体分布无要求，计算简单，可快速判断序列的随机性/分布一致性
局限	存在大量打结值（相同观测值）时，游程数判断受影响，需调整或更换方法

符号检验（Sign Test）知识点详解与推导

一、符号检验的核心定位与基本思想

符号检验是经典的非参数检验方法，核心用于连续总体的分位数检验（最常用为中位数检验），也是配对设计差异检验的常用非参数方法。

核心特性

无分布依赖：无需对总体分布做任何强假定（如正态性），仅要求总体为连续型，适用范围极广；
信息利用：仅利用样本观测值与待检验值的差值正负符号做推断，完全不依赖差值的绝对大小，因此对异常值、极端值的稳健性极强；
核心逻辑：通过正号、负号的数量是否符合原假设下的概率分布，判断是否拒绝原假设。

二、基础场景：总体中位数的符号检验（例7.6.2详解）

问题设定

设连续总体\(X\)的分布函数为\(F(x)\)，中位数为\(m_e\)，满足\(F(m_e)=0.5\)。待检验假设为：

\[H_0: F(0)=0.5 \quad \text{vs} \quad H_1: F(0)\neq0.5 \]

即检验总体中位数为0。

步骤1：构造符号统计量

设\(x_1,x_2,\cdots,x_n\)为来自总体\(X\)的样本，定义符号函数：

\[y_i = \begin{cases} 1, & x_i > 0 \\ 0, & x_i \leq 0 \end{cases}, \quad i=1,2,\cdots,n\]

记正号的总个数为符号统计量：

\[S^+ = \sum_{i=1}^n y_i \]

\(S^+\)的含义为：样本中大于0的观测值的个数。

步骤2：原假设下\(S^+\)的分布推导

当\(H_0\)成立时，总体中位数为0，因此：

单个样本观测值大于0的概率\(P(x_i>0)=1-F(0)=0.5\)；
单个样本观测值小于等于0的概率\(P(x_i\leq0)=F(0)=0.5\)。

因此，每个\(y_i\)独立同服从伯努利分布\(b(1,0.5)\)（单次试验成功概率为0.5，成功即\(x_i>0\)）。

\(n\)个独立伯努利试验的成功次数之和服从二项分布，因此在\(H_0\)为真时：

\[S^+ \sim b(n, 0.5) \]

步骤3：检验逻辑与拒绝域

\(H_0\)成立时，\(S^+\)的期望为\(E(S^+)=n\times0.5 = n/2\)，即正号个数应在总样本量的一半附近。

若\(S^+\)过大：说明样本中正数远多于负数，中位数大概率大于0，拒绝\(H_0\)；
若\(S^+\)过小：说明样本中负数远多于正数，中位数大概率小于0，拒绝\(H_0\)。

因此双侧检验的拒绝域形式为：

\[W = \{S^+ \leq c_1\} \cup \{S^+ \geq c_2\} \]

其中临界值\(c_1,c_2\)满足：

\[P(S^+ \leq c_1) \leq \alpha/2, \quad P(S^+ \geq c_2) \leq \alpha/2 \]

\(\alpha\)为给定的显著性水平。

三、一般场景：总体\(p\)分位数的符号检验（完整推导）

1. \(p\)分位数的定义

对于连续总体\(X\)，分布函数为\(F(x)\)，其\(p\)分位数\(x_p\)（\(0<p<1\)）满足：

\[F(x_p) = P(X \leq x_p) = p \]

连续总体下，\(x_p\)存在且唯一，分布函数\(F(x)\)严格单调递增。

2. 待检验假设与等价转化

我们要检验的原假设与备择假设为：

\[H_0: x_p \leq x_0 \quad \text{vs} \quad H_1: x_p > x_0 \]

其中\(x_0\)为给定的常数。

核心等价性推导

定义符号函数与成功概率：
对样本\(x_1,x_2,\cdots,x_n\)，定义：

\[y_i = \begin{cases} 1, & x_i > x_0 \\ 0, & x_i \leq x_0 \end{cases}, \quad i=1,2,\cdots,n\]
记单次试验的成功概率：

\[\theta = P(y_i=1) = P(X > x_0) = 1 - F(x_0) \]
原假设的等价转化：
由于\(F(x)\)严格单调递增，因此：

\[x_p \leq x_0 \iff F(x_0) \geq F(x_p) = p \]
两边取补集得：

\[1 - F(x_0) \leq 1 - p \iff \theta \leq 1-p \]
反之，若\(\theta \leq 1-p\)，则\(1-F(x_0)\leq1-p \implies F(x_0)\geq p=F(x_p) \implies x_0\geq x_p\)，即\(H_0\)成立。

因此，原分位数检验问题完全等价于二项分布的参数检验问题：

\[H_0: \theta \leq 1-p \quad \text{vs} \quad H_1: \theta > 1-p \]

3. 符号统计量的分布

\(y_1,y_2,\cdots,y_n\)独立同服从伯努利分布\(b(1,\theta)\)，因此符号统计量：

\[S^+ = \sum_{i=1}^n y_i \]

服从二项分布\(b(n,\theta)\)，即：

\[P(S^+=k) = \binom{n}{k} \theta^k (1-\theta)^{n-k}, \quad k=0,1,\cdots,n \]

4. 拒绝域与\(p\)值计算

对于等价的二项分布单边检验，\(S^+\)越大，说明\(\theta\)越大，越倾向于拒绝\(H_0\)，因此拒绝域形式为：

\[W = \{S^+ \geq c\} \]

其中临界值\(c\)为满足下式的最小整数：

\[c = \inf\left\{ k: \sum_{i=k}^n \binom{n}{i} (1-p)^i p^{n-i} \leq \alpha \right\} \]

注：\(H_0\)为\(\theta\leq1-p\)，最不利情况为\(\theta=1-p\)（边界值），此时犯第一类错误的概率最大，因此用\(\theta=1-p\)计算临界值，可保证整个\(H_0\)范围内第一类错误概率不超过\(\alpha\)。

\(p\)值计算

记符号统计量的观测值为\(S_0^*\)，则该检验的\(p\)值为：

\[p = P(S^+ \geq S_0^* \mid \theta=1-p) = \sum_{i=S_0^*}^n b(i;n,1-p) \]

其中\(b(i;n,1-p)=\binom{n}{i}(1-p)^i p^{n-i}\)为二项分布的概率质量函数。
若\(p<\alpha\)，则拒绝原假设\(H_0\)。

四、三种假设形式的符号检验完整总结

基于上述推导，我们可以得到分位数检验的三种完整形式，对应左侧单边、右侧单边、双侧检验，如下表所示：

原假设\(H_0\)	备择假设\(H_1\)	等价二项检验	拒绝域形式	检验的\(p\)值
\(x_p \leq x_0\)	\(x_p > x_0\)	\(H_0:\theta\leq1-p\) vs \(H_1:\theta>1-p\)	\(W_Ⅰ=\{S^+ \geq c\}\)	\(\sum_{i=S_0^*}^n b(i;n,1-p)\)
\(x_p \geq x_0\)	\(x_p < x_0\)	\(H_0:\theta\geq1-p\) vs \(H_1:\theta<1-p\)	\(W_Ⅱ=\{S^+ \leq c\}\)	\(\sum_{i=0}^{S_0^*} b(i;n,1-p)\)
\(x_p = x_0\)	\(x_p \neq x_0\)	\(H_0:\theta=1-p\) vs \(H_1:\theta\neq1-p\)	\(W_Ⅲ=\{S^+ \leq c_1 \text{ 或 } S^+ \geq c_2\}\)	\(2\min\left\{ \sum_{i=0}^{S_0^} b(i;n,1-p), \sum_{i=S_0^}^n b(i;n,1-p), 0.5 \right\}\)

补充说明

左侧单边检验的推导逻辑：\(x_p\geq x_0 \implies F(x_0)\leq p \implies \theta=1-F(x_0)\geq1-p\)，\(S^+\)越小越拒绝\(H_0\)；
双侧检验的\(p\)值取单侧\(p\)值的2倍，同时与0.5取最小值，避免\(p\)值超过1（当\(S_0^*\)接近\(n/2\)时，单侧\(p\)值可能大于0.5，此时\(p\)值最大为1）。

五、大样本正态近似

当样本量\(n\)较大时（通常要求\(np\geq5\)且\(n(1-p)\geq5\)），根据中心极限定理，二项分布\(b(n,\theta)\)可近似为正态分布：

\[S^+ \stackrel{近似}{\sim} N\left( n\theta, n\theta(1-\theta) \right) \]

在\(H_0\)成立时，\(\theta=1-p\)，因此构造标准化检验统计量：

\[Z = \frac{S^+ - n(1-p)}{\sqrt{np(1-p)}} \stackrel{近似}{\sim} N(0,1) \]

连续性修正

由于二项分布是离散分布，正态分布是连续分布，为提高近似精度，需进行连续性修正：

右侧单边检验（\(S^+\geq c\)）：修正为\(Z = \frac{S^+ - 0.5 - n(1-p)}{\sqrt{np(1-p)}}\)，拒绝域\(Z\geq z_\alpha\)；
左侧单边检验（\(S^+\leq c\)）：修正为\(Z = \frac{S^+ + 0.5 - n(1-p)}{\sqrt{np(1-p)}}\)，拒绝域\(Z\leq -z_\alpha\)；
双侧检验：拒绝域\(|Z|\geq z_{\alpha/2}\)。

其中\(z_\alpha\)为标准正态分布的上\(\alpha\)分位数。

六、符号检验的经典应用：配对样本差异检验

符号检验最常用的场景之一，是配对设计的非参数差异检验，作为配对t检验的替代方法（当配对差值不满足正态性时）。

问题设定

配对设计样本：\((x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)\)，其中\(x_i\)为处理A的观测值，\(y_i\)为处理B的观测值，差值\(d_i = x_i - y_i\)。
待检验假设：两个处理的效应无差异，即差值\(d_i\)的中位数为0，对应：

\[H_0: m_d=0 \quad \text{vs} \quad H_1: m_d\neq0 \]

检验步骤

计算配对差值\(d_i=x_i-y_i\)；
定义符号函数：\(y_i=1\)当\(d_i>0\)，\(y_i=0\)当\(d_i\leq0\)，统计正号个数\(S^+\)；
此时\(p=0.5\)，对应中位数检验，\(H_0\)下\(S^+\sim b(n,0.5)\)；
按双侧检验计算临界值或\(p\)值，做出决策。

七、符号检验的优缺点与适用条件

适用条件

总体为连续型（保证打结值\(x_i=x_0\)的概率为0）；
待检验目标为总体分位数（尤其是中位数），或配对样本的效应差异；
总体分布未知、不满足参数检验的正态性假定，或存在极端异常值。

优势

无分布依赖，适用范围极广，不受总体分布形式的限制；
稳健性极强，仅利用符号信息，完全不受极端异常值的影响；
计算简单，逻辑直观，易于理解和实现；
可用于有序分类数据（仅能比较大小、无法计算数值差异的等级数据）。

局限

信息利用率低：完全丢弃了差值的大小信息，当总体满足正态性时，检验效能远低于配对t检验等参数方法；
打结值敏感：当存在大量\(x_i=x_0\)（差值为0）的打结情况时，样本量被压缩，检验效能大幅下降，此时更推荐使用Wilcoxon符号秩检验；
小样本下，二项分布的临界值可能无法恰好满足显著性水平\(\alpha\)的要求，检验的实际显著性水平会低于名义水平。

八、符号检验核心知识点归纳总表

分类	核心内容
方法定位	经典非参数检验方法，核心用于连续总体的分位数检验、配对样本差异检验
核心原理	利用样本与待检验值差值的正负符号数量，通过二项分布做统计推断，不依赖总体分布
核心统计量	符号统计量\(S^+\)：样本中大于待检验值\(x_0\)的观测值个数，服从二项分布\(b(n,\theta)\)
检验前提	总体为连续型，保证分位数唯一、打结值概率为0
小样本检验	基于二项分布精确计算临界值或\(p\)值，分单边、双侧检验
大样本检验	基于中心极限定理做正态近似，需进行连续性修正，构造Z统计量
经典应用	1. 总体中位数检验；2. 配对设计的效应差异检验（配对t检验的非参数替代）
核心优势	无分布依赖、稳健性极强（抗异常值）、计算简单、适用有序分类数据
核心局限	丢弃数值大小信息，检验效能低于参数方法；对大量打结值敏感
决策规则	\(p\)值小于显著性水平\(\alpha\)时，拒绝原假设\(H_0\)；否则不拒绝\(H_0\)

符号检验例题详解（含完整推导、计算与原理对应）

一、例7.6.3 总体分位数的左侧单边符号检验

1. 问题背景与检验假设

业务背景：以往资料显示，该种圆钢90%的产品硬度不小于103 kg/mm²，即10%分位数\(x_{0.10}=103\)（10%分位数的定义：总体中10%的观测值≤\(x_{0.10}\)，90%的观测值≥\(x_{0.10}\)）。现抽取20根样本，检验该结论是否仍成立。
统计假设：
\[H_0: x_{0.10} \geq 103 \quad \text{vs} \quad H_1: x_{0.10} < 103 \]
显著性水平\(\alpha=0.05\)。

2. 原理对应（结合符号检验核心理论）

根据\(p\)分位数的定义，\(F(x_{0.10})=P(X \leq x_{0.10})=0.1\)，原假设\(H_0: x_{0.10} \geq 103\)等价于：

\[F(103) \leq F(x_{0.10}) = 0.1 \]

定义符号统计量的成功概率：

\[\theta = P(X > 103) = 1 - F(103) \]

因此原假设可等价转化为二项分布参数检验：

\[H_0: \theta \geq 1-0.1=0.9 \quad \text{vs} \quad H_1: \theta < 0.9 \]

符号统计量\(S^+\)：样本中硬度大于103的观测值个数（即差值\(x_i-103>0\)的正号个数）；
\(H_0\)成立时，\(S^+\)服从二项分布\(b(n, 0.9)\)，其中样本量\(n=20\)；
拒绝域逻辑：\(S^+\)越小，说明\(\theta\)越小，越倾向于拒绝\(H_0\)，因此拒绝域为\(\{S^+ \leq c\}\)。

3. 详细解题步骤

步骤1：计算差值，构造符号序列

对每个样本硬度\(x_i\)，计算差值\(z_i = x_i - 103\)，结果如下：

样本序号	1	2	3	4	5	6	7	8	9	10
硬度\(x_i\)	142	134	119	98	131	102	154	122	93	137
差值\(z_i\)	39	31	16	-5	28	-1	51	19	-10	34
符号	+	+	+	-	+	-	+	+	-	+

样本序号	11	12	13	14	15	16	17	18	19	20
硬度\(x_i\)	86	119	161	144	158	165	81	117	128	113
差值\(z_i\)	-17	16	58	41	55	62	-22	14	25	10
符号	-	+	+	+	+	+	-	+	+	+

步骤2：统计符号统计量的观测值

统计正号（\(z_i>0\)）的个数，得\(S_0^+ = 15\)。

步骤3：计算检验的\(p\)值

左侧单边检验的\(p\)值为：\(H_0\)成立时，\(S^+\)小于等于观测值15的累积概率，即

\[p = P(S^+ \leq 15 \mid S^+ \sim b(20, 0.9)) = \sum_{i=0}^{15} \binom{20}{i} 0.9^i 0.1^{20-i} \]

二项分布概率计算：

二项分布\(b(20,0.9)\)的累积概率，\(P(S^+ \leq15) = 1 - P(S^+ \geq16)\)
\(P(S^+ \geq16) = \sum_{i=16}^{20}\binom{20}{i}0.9^i0.1^{20-i} \approx 0.957\)
因此\(P(S^+ \leq15) = 1 - 0.957 = 0.043\)

步骤4：决策与结论

\(p=0.043 < \alpha=0.05\)，因此拒绝原假设\(H_0\)，不能认为该种圆钢的10%分位数\(x_{0.10}\)不小于103 kg/mm²，即原“90%产品硬度不小于103”的结论不成立。

4. 关键注意点

本题为左侧单边检验，拒绝域为\(S^+\)偏小的区域，\(p\)值为左侧累积概率；
原假设的边界值为\(\theta=0.9\)，因此用二项分布\(b(20,0.9)\)计算概率，保证第一类错误概率不超过\(\alpha\)；
若\(p\)值大于\(\alpha\)，则不拒绝原假设，仅说明没有足够证据推翻原结论，而非证明原结论成立。

二、例7.6.4 配对样本的双侧符号检验

1. 问题背景与检验假设

业务背景：工厂两个化验室每天同时从冷却水中取样，测量含氯量，共11组配对数据，检验两个化验室的测定结果是否存在显著性差异。
统计假设：
记化验室A的测量误差分布为\(F(x)\)，化验室B的为\(G(x)\)，检验
\[H_0: F(x) = G(x) \quad \text{vs} \quad H_1: F(x) \neq G(x) \]
显著性水平\(\alpha=0.05\)。

2. 配对设计的处理逻辑

配对数据的核心问题：每天的含氯量本身存在差异，因此\(x_i\)（化验室A）和\(y_i\)（化验室B）的差异，既包含化验室的系统误差，也包含当天含氯量的真实值差异。

通过配对差值消除真实值的影响：
设\(x_i = \mu_i + \xi_i\)，\(y_i = \mu_i + \eta_i\)，其中\(\mu_i\)为第\(i\)天冷却水的真实含氯量，\(\xi_i\)、\(\eta_i\)为两个化验室的测量误差。
差值\(z_i = x_i - y_i = \xi_i - \eta_i\)，完全消除了\(\mu_i\)的影响，仅保留两个化验室的误差差异。

当\(H_0\)成立时，\(\xi_i\)和\(\eta_i\)同分布，因此\(z_i = \xi_i - \eta_i\)的分布关于0对称，即\(P(z_i>0)=P(z_i<0)=0.5\)，差值的中位数为0，可使用双侧符号检验。

3. 详细解题步骤

步骤1：计算配对差值，统计符号

根据表格数据，计算差值\(z_i=x_i-y_i\)，并统计正负号：

序号\(i\)	1	2	3	4	5	6	7	8	9	10	11
差值\(z_i\)	0.03	-0.04	-0.16	0.01	-0.06	-0.05	-0.02	-0.1	-0.11	-0.07	-0.12
符号	+	-	-	+	-	-	-	-	-	-	-

步骤2：统计符号统计量的观测值

统计正号（\(z_i>0\)）的个数，得\(S_0^+ = 2\)，无差值为0的打结值，样本量\(n=11\)。

步骤3：计算检验的\(p\)值

\(H_0\)成立时，\(S^+ \sim b(11, 0.5)\)，双侧检验的\(p\)值为：

\[p = 2\min\left\{ P(S^+ \leq 2), P(S^+ \geq 2) \right\} \]

二项分布概率计算：

左侧累积概率：\(P(S^+ \leq 2) = \sum_{i=0}^{2} \binom{11}{i} 0.5^{11}\)
计算得：\(\binom{11}{0}0.5^{11} + \binom{11}{1}0.5^{11} + \binom{11}{2}0.5^{11} = (1+11+55)/2048 = 67/2048 \approx 0.0327\)
右侧累积概率：\(P(S^+ \geq 2) = 1 - P(S^+ \leq1) \approx 0.994\)
取最小值乘以2，得\(p=2\times0.0327 = 0.0654\)

步骤4：决策与结论

\(p=0.0654 > \alpha=0.05\)，因此不拒绝原假设\(H_0\)，在0.05的显著性水平下，没有足够证据表明两个化验室的测定结果存在显著性差异。

4. 关键注意点

本题为双侧检验，\(p\)值取单侧最小累积概率的2倍，避免\(p\)值超过1；
配对符号检验的核心是通过差值消除配对个体的固有差异，仅关注处理/组间的差异，是配对t检验的非参数替代方法，适用于差值不满足正态性的场景；
若存在差值为0的打结值，通常的处理方式是剔除打结值，样本量\(n\)相应减少；
本题\(p=0.0654\)接近0.05，若放宽显著性水平至\(\alpha=0.1\)，则会拒绝原假设，说明检验结果对显著性水平敏感，本质是符号检验的信息利用率低，检验效能弱于配对t检验。

三、两个例题的核心对比总结

对比维度	例7.6.3 分位数单边检验	例7.6.4 配对样本双侧检验
检验目标	检验总体10%分位数是否≥103	检验两个配对总体的分布是否相同
假设类型	左侧单边检验	双侧检验
符号统计量\(S^+\)	样本值大于103的正号个数	配对差值为正的正号个数
\(H_0\)下的分布	\(b(20, 0.9)\)	\(b(11, 0.5)\)
\(p\)值计算	左侧累积概率\(P(S^+ \leq 15)\)	2倍最小单侧累积概率
决策结果	\(p<0.05\)，拒绝\(H_0\)	\(p>0.05\)，不拒绝\(H_0\)
核心应用场景	总体分位数的检验	配对设计的组间差异检验

Wilcoxon秩和检验知识点详解与完整推导

一、秩和检验的核心定位

符号检验仅利用了观测值与中心位置差值的正负符号，完全丢弃了差值的大小信息，检验效能较低。Wilcoxon秩和检验（秩检验）由威尔科克森1945年提出，是经典的非参数检验方法，它同时结合了差值的符号和绝对值大小，充分利用样本信息，检验效能显著高于符号检验，且仍不依赖总体分布的正态性假定，适用范围极广。

秩和检验主要分为两大核心应用：

单样本/配对样本Wilcoxon符号秩检验：用于对称总体的中心位置检验（如配对设计的组间差异检验）；
两独立样本Wilcoxon秩和检验（Mann-Whitney U检验）：用于两个独立总体的位置差异检验，是两独立样本t检验的非参数替代方法。

二、基础概念：秩与秩统计量

1. 秩的定义

定义7.6.1 设\(x_1,x_2,\cdots,x_n\)是来自连续分布\(F(x)\)的简单随机样本，将观测值从小到大排序得到有序样本\(x_{(1)} \leq x_{(2)} \leq \cdots \leq x_{(n)}\)，观测值\(x_i\)在有序样本中的序号\(r\)称为\(x_i\)的秩，记为\(R_i=r\)。

核心说明：连续总体中，观测值相等（打结）的概率为0，因此每个观测值的秩唯一确定。
例7.6.5 设\(n=6\)，观测值为\(196,224,171,241,162,193\)，从小到大排序为\(162,171,193,196,224,241\)，对应秩为\(1,2,3,4,5,6\)，因此原观测值的秩依次为\(4,5,2,6,1,3\)。

2. 秩统计量

定义7.6.2 设\(x_1,x_2,\cdots,x_n\)是来自连续总体的样本，\(R_i\)是\(x_i\)的秩，称向量\(R=(R_1,R_2,\cdots,R_n)\)为样本的秩统计量，基于秩统计量构造的检验方法统称为秩检验。

三、单样本/配对样本Wilcoxon符号秩检验

1. 检验场景与假设

符号秩检验适用于对称连续总体的中心位置检验，最典型的场景是配对设计的组间差异检验：

配对样本\((x_i,y_i)\)，差值\(z_i=x_i-y_i\)，检验两个总体的分布是否相同，等价于检验差值\(z_i\)的分布关于0对称，即总体中位数为0。
原假设与备择假设：
\[H_0: \theta=0 \quad \text{vs} \quad H_1: \theta \neq 0 \]
其中\(\theta\)为总体的对称中心（中位数）。

2. 符号秩统计量的定义

定义7.6.3 设\(x_1,x_2,\cdots,x_n\)是样本，记\(R_i\)为\(|x_i|\)在\((|x_1|,|x_2|,\cdots,|x_n|)\)中的秩，定义指示函数：

\[I(x_i>0) = \begin{cases} 1, & x_i>0 \\ 0, & x_i \leq 0 \end{cases}\]

称符号秩和统计量：

\[W^+ = \sum_{i=1}^n R_i \cdot I(x_i>0) \]

\(W^+\)的含义为：所有正观测值的秩的总和。

核心逻辑：\(H_0\)成立时，总体关于0对称，正、负观测值的数量应接近，且绝对值的秩应均匀分布，\(W^+\)应接近总秩和的一半；若\(W^+\)过大或过小，说明正/负观测值的绝对值显著偏大，拒绝\(H_0\)。

3. 符号秩统计量的分布特性与推导

核心前提（\(H_0\)成立时）

总体关于0对称，因此\(P(x_i>0)=P(x_i<0)=0.5\)，每个观测值的符号与绝对值的秩相互独立；
所有秩\(1,2,\cdots,n\)等可能地分配给正、负观测值，每个秩被计入\(W^+\)的概率为0.5，且相互独立。

期望\(E(W^+)\)的推导

将\(W^+\)拆解为秩的加权和：\(W^+ = 1\cdot I_1 + 2\cdot I_2 + \cdots + n\cdot I_n\)，其中\(I_k\)为指示变量，代表秩为\(k\)的观测值为正，\(P(I_k=1)=0.5\)。

根据期望的线性性质：

\[E(W^+) = \sum_{k=1}^n k \cdot E(I_k) = 0.5 \cdot \sum_{k=1}^n k = 0.5 \cdot \frac{n(n+1)}{2} = \frac{n(n+1)}{4} \]

方差\(Var(W^+)\)的推导

由于\(I_1,\cdots,I_n\)相互独立，协方差为0，因此：

\[Var(W^+) = \sum_{k=1}^n Var(k\cdot I_k) = \sum_{k=1}^n k^2 \cdot Var(I_k) \]

其中\(Var(I_k)=0.5\times0.5=0.25\)，且\(\sum_{k=1}^n k^2 = \frac{n(n+1)(2n+1)}{6}\)，代入得：

\[Var(W^+) = 0.25 \cdot \frac{n(n+1)(2n+1)}{6} = \frac{n(n+1)(2n+1)}{24} \]

总秩和关系

正号秩和\(W^+\)与负号秩和\(W^-\)满足：

\[W^+ + W^- = 1+2+\cdots+n = \frac{n(n+1)}{2} \]

因此\(W^- = \frac{n(n+1)}{2} - W^+\)，二者完全线性相关，检验时仅需计算\(W^+\)即可。

4. 检验拒绝域与实施步骤

小样本检验（\(n\leq50\)）

查Wilcoxon符号秩检验临界值表，得临界值\(W_{\alpha/2}(n)\)和\(W_{1-\alpha/2}(n)\)，其中\(W_{1-\alpha/2}(n) = \frac{n(n+1)}{2} - W_{\alpha/2}(n)\)。

双侧检验拒绝域：\(\{W^+ \leq W_{\alpha/2}(n)\} \cup \{W^+ \geq W_{1-\alpha/2}(n)\}\)
左侧单侧检验（\(H_1:\theta<0\)）拒绝域：\(\{W^+ \leq W_{\alpha}(n)\}\)
右侧单侧检验（\(H_1:\theta>0\)）拒绝域：\(\{W^+ \geq W_{1-\alpha}(n)\}\)

大样本近似（\(n>50\)）

根据中心极限定理，\(H_0\)成立时\(W^+\)近似服从正态分布，构造标准化检验统计量：

\[Z = \frac{W^+ - \frac{n(n+1)}{4}}{\sqrt{\frac{n(n+1)(2n+1)}{24}}} \stackrel{近似}{\sim} N(0,1) \]

若存在打结（相同绝对值），需对分母进行修正，修正公式为：

\[Var(W^+) = \frac{n(n+1)(2n+1) - 0.5\sum_{j=1}^g (t_j^3 - t_j)}{24} \]

其中\(g\)为结的个数，\(t_j\)为第\(j\)个结的长度（相同绝对值的个数）。

5. 例题7.6.6 完整详解（配对样本符号秩检验）

问题背景

两个化验室每天同步测量冷却水含氯量，共11组配对数据，检验两个化验室的测定结果是否存在显著差异，\(\alpha=0.05\)。

检验步骤

计算配对差值：\(z_i = x_i(\text{化验室A}) - y_i(\text{化验室B})\)，结果如下：

\(i\) 1 2 3 4 5 6 7 8 9 10 11

\(z_i\) 0.03 -0.04 -0.16 0.01 -0.06 -0.05 -0.02 -0.1 -0.11 -0.07 -0.12
计算绝对值与秩：对\(|z_i|\)从小到大排序，赋予秩：
| \(|z_i|\) | 0.03 | 0.04 | 0.16 | 0.01 | 0.06 | 0.05 | 0.02 | 0.1 | 0.11 | 0.07 | 0.12 |
|:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |:---: |
| 秩\(R_i\) | 3 | 4 | 11 | 1 | 6 | 5 | 2 | 8 | 9 | 7 | 10 |
计算符号秩和统计量：正差值的秩为3和1，因此\(W^+ = 3+1=4\)。
确定拒绝域与决策：
查临界值表得\(W_{0.025}(11)=10\)，\(W_{0.975}(11)=\frac{11\times12}{2}-10=56\)，拒绝域为\(\{W^+\leq10\}\cup\{W^+\geq56\}\)。
观测值\(W^+=4\leq10\)，落在拒绝域内，因此拒绝原假设\(H_0\)，认为两个化验室的测定结果存在显著差异。

\(i\)	1	2	3	4	5	6	7	8	9	10	11
\(z_i\)	0.03	-0.04	-0.16	0.01	-0.06	-0.05	-0.02	-0.1	-0.11	-0.07	-0.12

与符号检验的对比

符号检验中，正号个数为2，\(p\)值为0.0654，在\(\alpha=0.05\)下不拒绝原假设；而符号秩检验利用了差值的大小信息，两个正差值的绝对值极小、秩极低，更能反映系统差异，检验效能显著更高。

四、两独立样本Wilcoxon秩和检验

1. 检验场景与假设

两独立样本秩和检验用于两个独立连续总体的位置差异检验，是两独立样本t检验的非参数替代方法，适用于数据不满足正态性、存在异常值的场景。

设两个独立总体的分布函数为\(F(x-\theta_1)\)和\(F(x-\theta_2)\)（分布形状相同，仅位置参数\(\theta\)不同），待检验的三类假设为：

类型	原假设\(H_0\)	备择假设\(H_1\)
右侧单侧	\(\theta_1 \leq \theta_2\)	\(\theta_1 > \theta_2\)
左侧单侧	\(\theta_1 \geq \theta_2\)	\(\theta_1 < \theta_2\)
双侧	\(\theta_1 = \theta_2\)	\(\theta_1 \neq \theta_2\)

2. 秩和统计量的定义

设\(x_1,x_2,\cdots,x_n\)是来自总体1的样本，\(y_1,y_2,\cdots,y_m\)是来自总体2的样本，将两组样本合并后从小到大排序，给每个观测值赋予秩\(1,2,\cdots,N\)（\(N=m+n\)）。

记\(R_i\)为样本\(y_i\)在合并样本中的秩，定义Wilcoxon秩和统计量：

\[W = \sum_{i=1}^m R_i \]

即第二组样本的秩的总和。

核心逻辑：\(H_0\)成立时，两个总体分布相同，两组样本的秩应均匀分布在\(1\)到\(N\)之间，\(W\)应接近理论期望；若\(W\)显著偏小/偏大，说明两组样本的位置存在显著差异，拒绝\(H_0\)。

3. 秩和统计量的分布特性与推导

核心前提（\(H_0\)成立时）

两个样本来自同一总体，因此\(m\)个\(y\)的秩是从\(1\)到\(N\)中随机抽取\(m\)个不同的数，所有组合等可能。

期望\(E(W)\)的推导

将\(W\)拆解为：\(W = \sum_{k=1}^N k\cdot I_k\)，其中\(I_k\)为指示变量，代表秩\(k\)被选入\(y\)的秩中，\(P(I_k=1)=\frac{m}{N}\)。

根据期望的线性性质：

\[E(W) = \sum_{k=1}^N k\cdot E(I_k) = \frac{m}{N} \cdot \frac{N(N+1)}{2} = \frac{m(m+n+1)}{2} \]

方差\(Var(W)\)的推导

通过指示变量的协方差化简，最终可得：

\[Var(W) = \frac{mn(m+n+1)}{12} \]

推导过程详见附录，核心结论与教材完全一致。

总秩和关系

两组样本的秩和满足：

\[W_x + W_y = \frac{N(N+1)}{2} = \frac{(m+n)(m+n+1)}{2} \]

因此用任意一组的秩和做检验，结果完全等价。

4. 检验拒绝域与实施步骤

小样本检验（\(m,n\leq20\)）

查Wilcoxon两样本秩和检验临界值表，得临界值\(W_{\alpha}(m,n)\)，其中\(W_{1-\alpha}(m,n) = m(m+n+1) - W_{\alpha}(m,n)\)。

左侧单侧检验（\(H_1:\theta_1>\theta_2\)，\(y\)的位置偏小）拒绝域：\(\{W \leq W_{\alpha}(m,n)\}\)
右侧单侧检验拒绝域：\(\{W \geq W_{1-\alpha}(m,n)\}\)
双侧检验拒绝域：\(\{W \leq W_{\alpha/2}(m,n)\} \cup \{W \geq W_{1-\alpha/2}(m,n)\}\)

大样本近似（\(m,n\geq20\)）

根据中心极限定理，\(H_0\)成立时\(W\)近似服从正态分布，构造标准化检验统计量：

\[Z = \frac{W - \frac{m(m+n+1)}{2}}{\sqrt{\frac{mn(m+n+1)}{12}}} \stackrel{近似}{\sim} N(0,1) \]

若存在打结，需对方差进行修正：

\[Var(W) = \frac{mn(N+1)}{12} \cdot \left[1 - \frac{\sum_{j=1}^g (t_j^3 - t_j)}{N^3 - N}\right] \]

其中\(N=m+n\)，\(g\)为结的个数，\(t_j\)为第\(j\)个结的长度。

5. 例题7.6.7 完整详解（两独立样本秩和检验）

问题背景

对羊毛进行处理前后的含脂率检测，处理前样本量\(n=6\)，处理后样本量\(m=5\)，检验处理后含脂率是否显著下降，\(\alpha=0.05\)。

处理前：\(0.20, 0.24, 0.66, 0.42, 0.12, 0.25\)
处理后：\(0.13, 0.07, 0.21, 0.08, 0.19\)
检验假设：\(H_0:\theta_1=\theta_2\) vs \(H_1:\theta_1>\theta_2\)（处理后含脂率下降）

检验步骤

合并排序与赋秩：将两组样本合并后从小到大排序，标记处理后样本（\(y\)）并赋予秩：

合并样本	0.07	0.08	0.12	0.13	0.19	0.20	0.21	0.24	0.25	0.42	0.66
组别	处理后	处理后	处理前	处理后	处理后	处理前	处理后	处理前	处理前	处理前	处理前
秩	1	2	3	4	5	6	7	8	9	10	11

计算秩和统计量：处理后样本的秩为\(1,2,4,5,7\)，因此\(W=1+2+4+5+7=19\)。
确定拒绝域与决策：
查临界值表得\(W_{0.05}(5,6)=20\)，拒绝域为\(\{W\leq20\}\)。
观测值\(W=19\leq20\)，落在拒绝域内，因此拒绝原假设\(H_0\)，认为处理后的羊毛含脂率显著下降。

五、秩和检验的关键补充说明

打结值的处理：当存在相同观测值（结）时，对相同观测值赋予平均秩，同时对方差进行修正，避免检验结果偏倚。
单侧检验的适配：符号秩检验和两样本秩和检验均可适配单侧检验，仅需调整拒绝域的方向，核心逻辑不变。
适用范围拓展：秩和检验不仅适用于连续型数值数据，也可用于有序分类数据（等级数据），这是参数t检验无法实现的。
检验效能：当总体满足正态性时，秩和检验的检验效能略低于t检验；当总体不满足正态性、存在异常值时，秩和检验的检验效能远高于t检验，稳健性极强。

六、核心非参数检验方法归纳总结表

检验方法	核心适用场景	检验统计量	原假设下的分布	期望	方差	核心优势	核心局限
符号检验	单样本分位数检验、配对样本差异检验	正号个数\(S^+\)	二项分布\(b(n,p)\)	\(np\)	\(np(1-p)\)	无分布依赖、计算极简、抗极端值	丢弃数值大小信息，检验效能最低
Wilcoxon符号秩检验	对称总体中心位置检验、配对样本差异检验	正号秩和\(W^+\)	符号秩分布	\(\frac{n(n+1)}{4}\)	\(\frac{n(n+1)(2n+1)}{24}\)	结合符号与数值大小，检验效能高、稳健性强	要求总体分布对称，大量打结时效能下降
Wilcoxon两样本秩和检验	两独立总体的位置差异检验	样本秩和\(W\)	秩和分布	\(\frac{m(m+n+1)}{2}\)	\(\frac{mn(m+n+1)}{12}\)	不要求正态性，适配有序分类数据，是t检验的最优非参数替代	要求两总体分布形状相同，大量打结时需修正

posted on 2026-03-21 14:45 Indian_Mysore 阅读(10) 评论(0) 收藏举报

刷新页面返回顶部

昆仑山:眼中无形心中有穴之穴人合一

非参数检验

游程检验（Run Test）知识点详解与推导

一、非参数检验与游程检验的定位

二、基础概念定义

1. 0-1序列变换

2. 游程与总游程数

3. 游程数的随机性逻辑

三、原假设下总游程数 \(R\) 的精确分布推导

前提设定

1. 隔板法基础：分游程的组合数

2. 情况1：\(R=2k\)（偶数）的概率分布

3. 情况2：\(R=2k+1\)（奇数）的概率分布

四、游程检验的期望与方差推导

1. 游程数的示性函数分解

2. 期望 \(E(R)\) 推导

3. 方差 \(D(R)\) 推导

五、游程检验的两类应用与实施步骤

应用1：单样本序列的随机性检验

检验假设

小样本检验步骤（\(n_1,n_2 \leq 20\)）

大样本近似检验（\(n_1,n_2 > 20\)）

应用2：两总体同分布检验

检验假设

检验逻辑

实施步骤

六、游程检验核心知识点归纳总结

符号检验（Sign Test）知识点详解与推导

一、符号检验的核心定位与基本思想

核心特性

二、基础场景：总体中位数的符号检验（例7.6.2详解）

问题设定

步骤1：构造符号统计量

步骤2：原假设下\(S^+\)的分布推导

步骤3：检验逻辑与拒绝域

三、一般场景：总体\(p\)分位数的符号检验（完整推导）

1. \(p\)分位数的定义

2. 待检验假设与等价转化

核心等价性推导

3. 符号统计量的分布

4. 拒绝域与\(p\)值计算

\(p\)值计算

四、三种假设形式的符号检验完整总结

补充说明

五、大样本正态近似

连续性修正

六、符号检验的经典应用：配对样本差异检验

问题设定

检验步骤

七、符号检验的优缺点与适用条件

适用条件

优势

局限

八、符号检验核心知识点归纳总表

符号检验例题详解（含完整推导、计算与原理对应）

一、例7.6.3 总体分位数的左侧单边符号检验

1. 问题背景与检验假设

2. 原理对应（结合符号检验核心理论）

3. 详细解题步骤

步骤1：计算差值，构造符号序列

步骤2：统计符号统计量的观测值

步骤3：计算检验的\(p\)值

步骤4：决策与结论

4. 关键注意点

二、例7.6.4 配对样本的双侧符号检验

1. 问题背景与检验假设

2. 配对设计的处理逻辑

3. 详细解题步骤

步骤1：计算配对差值，统计符号

步骤2：统计符号统计量的观测值

步骤3：计算检验的\(p\)值

步骤4：决策与结论

4. 关键注意点

三、两个例题的核心对比总结

Wilcoxon秩和检验知识点详解与完整推导

一、秩和检验的核心定位

二、基础概念：秩与秩统计量

1. 秩的定义

2. 秩统计量

三、单样本/配对样本Wilcoxon符号秩检验