昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.4.3正态分布单参数的双边假设检验

正态分布(μ已知)下方差σ的双边假设检验 详细讲解与推导

各位同学,今天我们用一整节课的时间,把正态总体均值μ已知时,方差σ的两类双边假设检验讲透。我从事数理统计教学与研究多年,这个知识点是参数假设检验的核心内容之一,也是理解一致最优检验(UMPT)、一致最优无偏检验(UMPUT)的经典案例,我们从基础铺垫、定理依据、逐式推导、实际意义四个维度,把这个知识点拆解得明明白白。


一、前置基础知识铺垫

在正式推导前,我们先把所有用到的基础概念、定理、分布性质讲清楚,这是后续所有推导的根基。

1. 样本与分布前提

我们的研究对象是:独立同分布的样本 \(X_1,X_2,\dots,X_n\),且 \(X_i \sim N(\mu_0,\sigma^2)\),其中均值\(\mu=\mu_0\)是已知常数,方差\(\sigma>0\)是我们要检验的未知参数。

核心分布性质:
对每个样本,标准化后 \(\frac{X_i - \mu_0}{\sigma} \sim N(0,1)\),且相互独立;根据卡方分布的定义,独立标准正态变量的平方和服从卡方分布,因此:

\[\frac{T(X)}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \mu_0)^2 \sim \chi^2(n) \]

其中 \(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\) 是我们的核心充分统计量,这个分布性质是后续所有概率计算、定解条件推导的核心。

2. 单参数指数族分布

我们先写出样本的联合概率密度函数:

\[\begin{align*} f(x_1,\dots,x_n;\sigma) &= \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma} \exp\left\{ -\frac{(x_i - \mu_0)^2}{2\sigma^2} \right\} \\ &= (2\pi)^{-n/2} \sigma^{-n} \exp\left\{ -\frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu_0)^2 \right\} \end{align*} \]

令参数 \(\theta = -\frac{1}{2\sigma^2}\),则密度可改写为单参数指数族的标准形式:

\[f(x;\theta) = C(\theta) \exp\left\{ Q(\theta) T(x) \right\} h(x) \]

其中:

  • \(C(\theta)=(2\pi)^{-n/2} (-2\theta)^{n/2}\)\(Q(\theta)=\theta\)\(\theta\)\(\sigma\)的严格单调递增函数)
  • 充分统计量 \(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\)\(h(x)\equiv1\)

这说明:该分布族是关于\(T(X)\)的单参数指数族,且\(T(X)\)的分布是连续分布(卡方分布为连续分布),完全满足我们后续用到的UMPT、UMPUT存在性定理的前提条件。

3. 假设检验核心概念

  1. 检验函数\(\phi(x)\):样本的函数,取值在\([0,1]\),表示当观测到样本\(x\)时,拒绝原假设\(H_0\)的概率。非随机化检验中,\(\phi(x)\)仅取0和1:\(\phi(x)=1\)表示拒绝\(H_0\)\(\phi(x)=0\)表示接受\(H_0\)
  2. 否定域(拒绝域)\(R^+\)\(\phi(x)=1\)对应的所有样本\(x\)的集合,即拒绝原假设的样本观测值的范围。
  3. 第一类错误与检验水平\(\alpha\)\(H_0\)为真时拒绝\(H_0\)的概率,即\(E_{\theta \in \Theta_0}[\phi(X)] = P(\text{拒绝}H_0 | H_0\text{为真})\),检验水平\(\alpha\)要求该概率不超过\(\alpha\),即\(\sup_{\theta \in \Theta_0} E_\theta[\phi(X)] \leq \alpha\)
  4. UMPT(一致最优检验):在所有水平为\(\alpha\)的检验中,对备择假设\(\Theta_1\)下的所有参数,功效(\(1-\)第二类错误概率)都达到最大的检验,是假设检验中最优的检验。
  5. UMPUT(一致最优无偏检验):当UMPT不存在时,我们约束检验为无偏检验(备择假设下的功效不低于水平\(\alpha\),即\(E_{\theta \in \Theta_1}[\phi(X)] \geq \alpha\)),在所有无偏检验中一致最优的检验,就是UMPUT。

4. 核心定理依据

我们本次推导完全基于两个单参数指数族的检验定理,先明确定理内容:

定理6.4.2(双边区间假设的UMPT存在性)

对单参数指数族分布,\(Q(\theta)\)\(\theta\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对检验问题:

\[H_0: \theta \leq \theta_1 \text{ 或 } \theta \geq \theta_2 \longleftrightarrow H_1: \theta_1 < \theta < \theta_2 \]

水平为\(\alpha\)的UMPT存在,检验函数形式为:

\[\phi(x) = \begin{cases} 1, & k_1 \leq T(x) \leq k_2 \\ 0, & T(x) < k_1 \text{ 或 } T(x) > k_2 \end{cases}\]

其中\(k_1,k_2\)由定解条件 \(E_{\theta_1}[\phi(X)] = \alpha\)\(E_{\theta_2}[\phi(X)] = \alpha\) 唯一确定。

定理6.4.4(点假设双边检验的UMPUT存在性)

对单参数指数族分布,\(Q(\theta)\)\(\theta\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对双边检验问题:

\[H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta \neq \theta_0 \]

水平为\(\alpha\)的UMPUT存在,检验函数形式为:

\[\phi(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ 0, & k_1 \leq T(x) \leq k_2 \end{cases}\]

其中\(k_1,k_2\)由两个定解条件唯一确定:

  1. 水平条件:\(E_{\theta_0}[\phi(X)] = \alpha\)
  2. 无偏性条件:\(E_{\theta_0}[\phi(X)T(X)] = \alpha E_{\theta_0}[T(X)]\)

二、检验问题(i):\(H_0: \sigma \leq \sigma_1 \text{ 或 } \sigma \geq \sigma_2 \longleftrightarrow H_1: \sigma_1 < \sigma < \sigma_2\)\(\mu=\mu_0\)已知)

这个检验问题是要判断方差是否落在区间\((\sigma_1,\sigma_2)\)内,是典型的区间原假设的双边检验,我们一步步推导。

步骤1:参数映射,匹配定理形式

我们的参数是\(\sigma>0\),令\(\theta = -\frac{1}{2\sigma^2}\),则\(\theta\)\(\sigma\)严格单调递增的一一对应关系:

  • \(\sigma \leq \sigma_1 \iff \theta = -\frac{1}{2\sigma^2} \leq -\frac{1}{2\sigma_1^2} = \theta_1\)
  • \(\sigma \geq \sigma_2 \iff \theta = -\frac{1}{2\sigma^2} \geq -\frac{1}{2\sigma_2^2} = \theta_2\)

因此原假设与备择假设可等价改写为:

\[H_0: \theta \leq \theta_1 \text{ 或 } \theta \geq \theta_2 \longleftrightarrow H_1: \theta_1 < \theta < \theta_2 \]

完全匹配定理6.4.2的检验问题形式,且满足指数族、\(T(X)\)分布连续的前提,因此水平为\(\alpha\)的UMPT存在。

步骤2:写出检验函数与否定域

根据定理6.4.2,直接得到该检验的UMPT的检验函数:

\[\phi_1(x) = \begin{cases} 1, & k_1 \leq T(x) \leq k_2 \\ 0, & T(x) < k_1 \text{ 或 } T(x) > k_2 \end{cases}\]

其中\(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\)

否定域(拒绝域)是\(\phi_1(x)=1\)的样本集合,即:

\[R^+ = \left\{ x: k_1 \leq \sum_{i=1}^n (x_i - \mu_0)^2 \leq k_2 \right\} \]

(连续分布下,等号与不等号不影响概率计算,因此也可写为开区间形式)

步骤3:推导定解条件,确定\(k_1,k_2\)

根据定理6.4.2,\(k_1,k_2\)需要满足:在原假设的两个边界点\(\sigma=\sigma_1\)\(\sigma=\sigma_2\)处,第一类错误概率恰好为\(\alpha\),即:

\[E_{\sigma=\sigma_1}[\phi_1(X)] = \alpha, \quad E_{\sigma=\sigma_2}[\phi_1(X)] = \alpha \]

由于\(\phi_1(X)\)是示性函数,期望等价于概率,因此:

\[P_{\sigma_1}\left( k_1 \leq \sum_{i=1}^n (X_i - \mu_0)^2 \leq k_2 \right) = \alpha \]

\[P_{\sigma_2}\left( k_1 \leq \sum_{i=1}^n (X_i - \mu_0)^2 \leq k_2 \right) = \alpha \]

利用我们的核心分布性质\(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\),对不等式两边同时除以\(\sigma^2\),做标准化变形:

\(\sigma=\sigma_1\)

\[P\left( \frac{k_1}{\sigma_1^2} \leq \frac{\sum_{i=1}^n (X_i - \mu_0)^2}{\sigma_1^2} \leq \frac{k_2}{\sigma_1^2} \right) = \alpha \]

\[P\left( \frac{k_1}{\sigma_1^2} \leq \chi^2(n) \leq \frac{k_2}{\sigma_1^2} \right) = \alpha \]

\(\sigma=\sigma_2\)

\[P\left( \frac{k_1}{\sigma_2^2} \leq \frac{\sum_{i=1}^n (X_i - \mu_0)^2}{\sigma_2^2} \leq \frac{k_2}{\sigma_2^2} \right) = \alpha \]

\[P\left( \frac{k_1}{\sigma_2^2} \leq \chi^2(n) \leq \frac{k_2}{\sigma_2^2} \right) = \alpha \]

用卡方分布的概率密度函数\(\chi^2(n,y)\)(自由度为\(n\)的卡方分布pdf)的积分形式表示,得到关于\(k_1,k_2\)的方程组:

\[\begin{cases} \displaystyle \int_{\frac{k_1}{\sigma_1^2}}^{\frac{k_2}{\sigma_1^2}} \chi^2(n,y) dy = \alpha \\ \displaystyle \int_{\frac{k_1}{\sigma_2^2}}^{\frac{k_2}{\sigma_2^2}} \chi^2(n,y) dy = \alpha \end{cases} \]

联立求解该方程组,即可得到\(k_1,k_2\)的唯一解,从而确定检验函数与拒绝域。

补充说明

该检验是严格的UMPT,是该检验问题下的最优检验,但由于卡方分布的积分无闭式解析解,\(k_1,k_2\)需要通过数值方法求解,计算复杂度高,因此实际应用中较少使用,更多是理论层面的最优性意义。


三、检验问题(ii):\(H_0: \sigma = \sigma_0 \longleftrightarrow H_1: \sigma \neq \sigma_0\)\(\mu=\mu_0\)已知)

这个检验是我们实际应用中最常用的方差双侧检验,即判断总体方差是否等于给定值\(\sigma_0\),我们同样一步步推导。

步骤1:匹配定理形式

同样令\(\theta = -\frac{1}{2\sigma^2}\),则原假设与备择假设等价于:

\[H_0: \theta = \theta_0 = -\frac{1}{2\sigma_0^2} \longleftrightarrow H_1: \theta \neq \theta_0 \]

完全匹配定理6.4.4的双边点假设检验形式,满足指数族、\(T(X)\)分布连续的前提,因此水平为\(\alpha\)的UMPUT存在。

步骤2:写出检验函数与否定域

根据定理6.4.4,直接得到该检验的UMPUT的检验函数:

\[\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ 0, & k_1 \leq T(x) \leq k_2 \end{cases}\]

其中\(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\)

对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:

\[R^+ = \left\{ x: \sum_{i=1}^n (x_i - \mu_0)^2 < k_1 \text{ 或 } \sum_{i=1}^n (x_i - \mu_0)^2 > k_2 \right\} \]

步骤3:推导定解条件,确定\(k_1,k_2\)

根据定理6.4.4,\(k_1,k_2\)需要满足两个条件:水平条件(a)和无偏性条件(b),我们分别推导。

条件(a):水平条件\(E_{\sigma_0}[\phi_2(X)] = \alpha\)

\(\phi_2(X)\)是示性函数,期望等价于概率:

\[E_{\sigma_0}[\phi_2(X)] = P_{\sigma_0}\left( T(X) < k_1 \text{ 或 } T(X) > k_2 \right) = \alpha \]

根据对立事件的概率公式,可得:

\[P_{\sigma_0}\left( k_1 \leq T(X) \leq k_2 \right) = 1 - \alpha \]

同样利用核心分布性质\(\frac{T(X)}{\sigma_0^2} \sim \chi^2(n)\),不等式两边除以\(\sigma_0^2\),变形为:

\[P\left( \frac{k_1}{\sigma_0^2} \leq \frac{T(X)}{\sigma_0^2} \leq \frac{k_2}{\sigma_0^2} \right) = 1 - \alpha \]

\[P\left( \frac{k_1}{\sigma_0^2} \leq \chi^2(n) \leq \frac{k_2}{\sigma_0^2} \right) = 1 - \alpha \]

用积分形式表示,得到第一个方程:

\[\int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} \chi^2(n,y) dy = 1 - \alpha \tag{6.4.26} \]

条件(b):无偏性条件\(E_{\sigma_0}[\phi_2(X)T(X)] = \alpha E_{\sigma_0}[T(X)]\)

首先计算\(E_{\sigma_0}[T(X)]\)
\(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\),每个\((X_i - \mu_0)^2\)的期望为\(E[(X_i - \mu_0)^2] = \text{Var}(X_i) = \sigma_0^2\),因此:

\[E_{\sigma_0}[T(X)] = \sum_{i=1}^n E[(X_i - \mu_0)^2] = n\sigma_0^2 \]

代入无偏性条件,右边为\(\alpha \cdot n\sigma_0^2 = n\alpha \sigma_0^2\),因此条件(b)可写为:

\[E_{\sigma_0}[\phi_2(X)T(X)] = n\alpha \sigma_0^2 \]

我们对式子做等价变形:两边同时减去\(E_{\sigma_0}[T(X)]\),得:

\[E_{\sigma_0}[\phi_2(X)T(X)] - E_{\sigma_0}[T(X)] = n\alpha \sigma_0^2 - n\sigma_0^2 \]

\[-E_{\sigma_0}\left[ (1 - \phi_2(X)) T(X) \right] = -n(1 - \alpha)\sigma_0^2 \]

消去负号后得到:

\[E_{\sigma_0}\left[ (1 - \phi_2(X)) T(X) \right] = n(1 - \alpha)\sigma_0^2 \]

根据\(\phi_2(X)\)的定义,\(1 - \phi_2(X)\)是事件\(\{k_1 \leq T(X) \leq k_2\}\)的示性函数,因此:

\[E_{\sigma_0}\left[ T(X) \cdot I\{k_1 \leq T(X) \leq k_2\} \right] = n(1 - \alpha)\sigma_0^2 \]

接下来做变量替换:令\(Y = \frac{T(X)}{\sigma_0^2}\),则\(T(X) = Y \sigma_0^2\),且\(Y \sim \chi^2(n)\),代入上式:

\[E\left[ Y \sigma_0^2 \cdot I\left\{ \frac{k_1}{\sigma_0^2} \leq Y \leq \frac{k_2}{\sigma_0^2} \right\} \right] = n(1 - \alpha)\sigma_0^2 \]

两边同时除以\(\sigma_0^2\),化简得:

\[E\left[ Y \cdot I\left\{ \frac{k_1}{\sigma_0^2} \leq Y \leq \frac{k_2}{\sigma_0^2} \right\} \right] = n(1 - \alpha) \]

用积分形式表示,得到第二个方程:

\[\int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} y \cdot \chi^2(n,y) dy = n(1 - \alpha) \tag{6.4.27} \]

联立方程(6.4.26)和(6.4.27),即可唯一解出\(k_1,k_2\),得到严格的UMPUT。

步骤4:实际应用的等尾近似解

精确求解上述方程组需要复杂的数值计算,实际应用中我们采用等尾分位数近似,该方法计算简便,且大样本下近似效果极佳,也是我们教材中最终给出的实用形式。

等尾近似的核心思想:让卡方分布的左右两侧尾部概率各为\(\alpha/2\),即:

\[P\left( \chi^2(n) < \frac{k_1}{\sigma_0^2} \right) = \frac{\alpha}{2}, \quad P\left( \chi^2(n) > \frac{k_2}{\sigma_0^2} \right) = \frac{\alpha}{2} \]

根据卡方分布分位数的定义:\(\chi^2(n,p)\)表示自由度为\(n\)的卡方分布的\(p\)分位数,即\(P(\chi^2(n) \leq \chi^2(n,p))=p\),因此:

\[\frac{k_1}{\sigma_0^2} = \chi^2\left(n, \frac{\alpha}{2}\right), \quad \frac{k_2}{\sigma_0^2} = \chi^2\left(n, 1 - \frac{\alpha}{2}\right) \]

由此得到\(k_1,k_2\)的近似解:

\[k_1 = \sigma_0^2 \cdot \chi^2\left(n, \frac{\alpha}{2}\right), \quad k_2 = \sigma_0^2 \cdot \chi^2\left(n, 1 - \frac{\alpha}{2}\right) \]

将其代入拒绝域,得到最终的近似否定域:

\[R^+ = \left\{ x: \frac{\sum_{i=1}^n (x_i - \mu_0)^2}{\sigma_0^2} < \chi^2\left(n, \frac{\alpha}{2}\right) \text{ 或 } \frac{\sum_{i=1}^n (x_i - \mu_0)^2}{\sigma_0^2} > \chi^2\left(n, 1 - \frac{\alpha}{2}\right) \right\} \tag{6.4.28} \]

补充说明

  1. 该近似解严格满足水平条件\(E_{\sigma_0}[\phi_2(X)]=\alpha\),仅不严格满足无偏性条件,但样本量\(n\)较大时,与精确UMPUT的差异极小,是实际应用中通用的方差双侧检验方法。
  2. 该检验就是我们常说的卡方检验(\(\chi^2\)检验),是正态总体方差检验的标准方法。

四、知识点归纳总结表

检验类型 区间原假设双边检验(UMPT) 点原假设双边检验(UMPUT)
检验问题 \(H_0: \sigma \leq \sigma_1\)\(\sigma \geq \sigma_2\)
\(H_1: \sigma_1 < \sigma < \sigma_2\)
\(\mu=\mu_0\)已知)
\(H_0: \sigma = \sigma_0\)
\(H_1: \sigma \neq \sigma_0\)
\(\mu=\mu_0\)已知)
核心充分统计量 \(T(X) = \sum_{i=1}^n (X_i - \mu_0)^2\) \(T(X) = \sum_{i=1}^n (X_i - \mu_0)^2\)
核心分布 \(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\) \(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\)
检验函数形式 \(\phi_1(x) = \begin{cases} 1, & k_1 \leq T(x) \leq k_2 \\ 0, & T(x) < k_1 \text{ 或 } T(x) > k_2 \end{cases}\) \(\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ 0, & k_1 \leq T(x) \leq k_2 \end{cases}\)
拒绝域(否定域) \(R^+ = \left\{ k_1 \leq \sum_{i=1}^n (x_i - \mu_0)^2 \leq k_2 \right\}\) 精确形式:\(R^+ = \left\{ \sum_{i=1}^n (x_i - \mu_0)^2 < k_1 \text{ 或 } > k_2 \right\}\)
近似实用形式:\(R^+ = \left\{ \frac{T(x)}{\sigma_0^2} < \chi^2(n,\alpha/2) \text{ 或 } \frac{T(x)}{\sigma_0^2} > \chi^2(n,1-\alpha/2) \right\}\)
定解条件 联立方程组:
\(\begin{cases} \displaystyle \int_{\frac{k_1}{\sigma_1^2}}^{\frac{k_2}{\sigma_1^2}} \chi^2(n,y) dy = \alpha \\ \displaystyle \int_{\frac{k_1}{\sigma_2^2}}^{\frac{k_2}{\sigma_2^2}} \chi^2(n,y) dy = \alpha \end{cases}\)
精确解联立方程组:
\(\begin{cases} \displaystyle \int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} \chi^2(n,y) dy = 1 - \alpha \\ \displaystyle \int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} y \cdot \chi^2(n,y) dy = n(1 - \alpha) \end{cases}\)
近似解:等尾分位数\(\chi^2(n,\alpha/2)\)\(\chi^2(n,1-\alpha/2)\)
检验最优性 水平\(\alpha\)下的一致最优检验(UMPT) 水平\(\alpha\)下的一致最优无偏检验(UMPUT)
应用场景 理论研究,验证方差是否落在指定区间,实际应用较少 实际工程、统计分析中最常用的正态总体方差双侧检验,应用广泛

五、最终总结

  1. 本次讲解的两类检验,核心前提都是正态总体均值\(\mu\)已知,核心统计量都是离均差平方和\(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\),核心分布都是自由度为\(n\)的卡方分布,这是整个知识点的核心主线。
  2. 区间原假设的双边检验,存在严格的UMPT,是理论上的最优检验,但计算复杂,实际应用受限;点原假设的双边检验,不存在UMPT,但存在UMPUT,其等尾近似解计算简便,是实际中方差检验的标准方法。
  3. 大家要注意区分:\(\mu\)已知时,卡方分布的自由度是\(n\);后续我们会学到\(\mu\)未知时,需要用样本均值代替总体均值,自由度会变为\(n-1\),这是两个知识点最核心的区别,大家一定要记牢。

正态分布(σ已知)下均值μ的双边假设检验 详细讲解与推导

各位同学,我们今天接续上一节课的内容,完整讲解正态总体方差σ已知时,均值μ的两类双边假设检验。这部分内容是参数检验的核心基础,也是大家熟知的Z检验(U检验)的理论来源,我会从定理依据、逐式推导、分布性质、实际意义四个维度,把这个知识点讲透彻,和上一节方差检验的内容形成完整的知识体系。


一、前置基础知识铺垫

在正式推导前,我们先把所有用到的基础概念、定理、分布性质明确下来,确保后续推导的严谨性。

1. 样本与核心分布前提

我们的研究对象是:独立同分布的样本 \(X_1,X_2,\dots,X_n\),且 \(X_i \sim N(\mu,\sigma_0^2)\),其中方差\(\sigma=\sigma_0\)是已知常数,均值\(\mu \in \mathbb{R}\)是我们要检验的未知参数。

核心分布性质:
正态分布的线性组合仍服从正态分布,因此样本均值 \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\) 的分布为:

\[\overline{X} \sim N\left( \mu, \frac{\sigma_0^2}{n} \right) \]

对其做标准化,可得我们后续推导的核心统计量:

\[U = \frac{\sqrt{n}(\overline{X} - \mu)}{\sigma_0} \sim N(0,1) \]

其中\(N(0,1)\)为标准正态分布,其分布函数记为\(\Phi(z) = P(N(0,1) \leq z)\),这是我们所有概率计算的基础。

2. 单参数指数族分布

我们先写出样本的联合概率密度函数,验证其指数族形式:

\[\begin{align*} f(x_1,\dots,x_n;\mu) &= \prod_{i=1}^n \frac{1}{\sqrt{2\pi}\sigma_0} \exp\left\{ -\frac{(x_i - \mu)^2}{2\sigma_0^2} \right\} \\ &= (2\pi\sigma_0^2)^{-n/2} \exp\left\{ -\frac{\sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2}{2\sigma_0^2} \right\} \end{align*} \]

整理为单参数指数族的标准形式 \(f(x;\mu) = C(\mu) \exp\left\{ Q(\mu) T(x) \right\} h(x)\),其中:

  • \(Q(\mu) = \frac{\mu}{\sigma_0^2}\),是\(\mu\)的严格单调递增函数;
  • 充分统计量 \(T(x) = \sum_{i=1}^n x_i = n\overline{X}\),因此\(\overline{X}\)也是等价的充分统计量(一一对应变换);
  • \(h(x) = \exp\left\{ -\frac{\sum_{i=1}^n x_i^2}{2\sigma_0^2} \right\}\),与参数\(\mu\)无关。

这说明:该分布族是关于\(T=\overline{X}\)的单参数指数族,且\(\overline{X}\)的分布为连续的正态分布,完全满足UMPUT存在性定理的前提条件。

3. 核心定理依据

本次推导完全基于两个单参数指数族的双边检验定理,先明确定理内容:

定理6.4.3(区间原假设双边检验的UMPUT存在性)

对单参数指数族分布,\(Q(\mu)\)\(\mu\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对检验问题:

\[H_0: \mu_1 \leq \mu \leq \mu_2 \longleftrightarrow H_1: \mu < \mu_1 \text{ 或 } \mu > \mu_2 \]

水平为\(\alpha\)一致最优无偏检验(UMPUT)存在,检验函数形式为:

\[\phi(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ 0, & k_1 \leq T(x) \leq k_2 \end{cases}\]

其中\(k_1,k_2\)由定解条件 \(E_{\mu_1}[\phi(X)] = \alpha\)\(E_{\mu_2}[\phi(X)] = \alpha\) 唯一确定。

定理6.4.5(点原假设对称双边检验的UMPUT存在性)

对单参数指数族分布,针对双边检验问题:

\[H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu \neq \mu_0 \]

若充分统计量\(T(X)\)的分布关于\(\mu_0\)对称,则水平为\(\alpha\)的UMPUT存在,且具有对称的检验函数形式:

\[\phi(x) = \begin{cases} 1, & |T(x) - \mu_0| > k \\ 0, & |T(x) - \mu_0| < k \end{cases}\]

其中\(k\)由水平条件 \(E_{\mu_0}[\phi(X)] = \alpha\) 唯一确定。

4. 标准正态分布分位数定义

我们用\(z_p\)表示标准正态分布的\(p\)分位数,即\(\Phi(z_p) = P(N(0,1) \leq z_p) = p\)
常用的上\(\alpha/2\)分位数记为\(z_{1-\alpha/2}\),满足\(\Phi(z_{1-\alpha/2}) = 1 - \frac{\alpha}{2}\),即\(P(N(0,1) > z_{1-\alpha/2}) = \frac{\alpha}{2}\),由对称性可得\(P(N(0,1) < -z_{1-\alpha/2}) = \frac{\alpha}{2}\),因此\(P(|N(0,1)| > z_{1-\alpha/2}) = \alpha\),这是我们后续简化计算的核心性质。


二、检验问题(i):\(H_0: \mu_1 \leq \mu \leq \mu_2 \longleftrightarrow H_1: \mu < \mu_1 \text{ 或 } \mu > \mu_2\)\(\sigma=\sigma_0\)已知)

这个检验问题是要判断总体均值是否落在指定区间\([\mu_1,\mu_2]\)之外,是区间原假设的双边检验,我们一步步完成推导。

步骤1:匹配定理适用条件

该检验问题完全匹配定理6.4.3的形式:原假设为参数的区间约束,备择假设为区间外的双边区域;同时分布族是关于\(\overline{X}\)的单参数指数族,\(\overline{X}\)的分布连续,因此水平为\(\alpha\)的UMPUT存在。

步骤2:写出检验函数与拒绝域

根据定理6.4.3,以充分统计量\(\overline{X}\)为检验统计量,直接得到该检验的UMPUT的检验函数:

\[\phi_2(x) = \begin{cases} 1, & \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \\ 0, & k_1 \leq \overline{X} \leq k_2 \end{cases}\]

对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:

\[R^+ = \left\{ x: \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \right\} \]

步骤3:推导定解条件,确定\(k_1,k_2\)

根据定理6.4.3,\(k_1,k_2\)需要满足:在原假设的两个边界点\(\mu=\mu_1\)\(\mu=\mu_2\)处,第一类错误概率恰好为检验水平\(\alpha\),即:

\[E_{\mu=\mu_1}[\phi_2(X)] = \alpha, \quad E_{\mu=\mu_2}[\phi_2(X)] = \alpha \]

由于\(\phi_2(X)\)是示性函数,期望等价于拒绝原假设的概率,因此:

\[E_{\mu_i}[\phi_2(X)] = P_{\mu_i}\left( \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \right) = \alpha, \quad i=1,2 \]

根据对立事件的概率公式,上式可等价改写为:

\[P_{\mu_i}\left( k_1 \leq \overline{X} \leq k_2 \right) = 1 - \alpha, \quad i=1,2 \]

接下来利用正态分布的标准化性质,对不等式做变形:
已知当\(\mu=\mu_i\)时,\(\frac{\sqrt{n}(\overline{X} - \mu_i)}{\sigma_0} \sim N(0,1)\),对不等式\(k_1 \leq \overline{X} \leq k_2\)的三项同时减去\(\mu_i\),乘以\(\frac{\sqrt{n}}{\sigma_0}\),可得:

\[\frac{\sqrt{n}(k_1 - \mu_i)}{\sigma_0} \leq \frac{\sqrt{n}(\overline{X} - \mu_i)}{\sigma_0} \leq \frac{\sqrt{n}(k_2 - \mu_i)}{\sigma_0} \]

该不等式中间的变量服从标准正态分布,因此概率可通过标准正态分布函数\(\Phi(\cdot)\)表示,得到:

\[\Phi\left( \frac{\sqrt{n}(k_2 - \mu_i)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_i)}{\sigma_0} \right) = 1 - \alpha, \quad i=1,2 \]

由此得到关于\(k_1,k_2\)的联立方程组:

\[\begin{cases} \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_1)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_1)}{\sigma_0} \right) = 1 - \alpha \\ \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_2)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_2)}{\sigma_0} \right) = 1 - \alpha \end{cases} \]

联立求解该方程组,即可得到\(k_1,k_2\)的唯一解,从而确定检验函数与拒绝域。

补充说明

该检验是该问题下水平\(\alpha\)的UMPUT,是无偏检验中的最优检验,但由于标准正态分布函数无闭式解析解,\(k_1,k_2\)需要通过数值方法或正态分布表迭代求解,计算复杂度较高,因此更多用于理论研究,实际工程应用中较少使用。


三、检验问题(ii):\(H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu \neq \mu_0\)\(\sigma=\sigma_0\)已知)

这个检验是我们实际应用中最常用的正态总体均值双侧Z检验(U检验),用于判断总体均值是否等于给定的目标值\(\mu_0\),我们完成完整推导。

步骤1:匹配定理适用条件

该检验问题是点原假设的双边检验,完全匹配定理6.4.5的适用场景:

  1. 分布族是关于\(\overline{X}\)的单参数指数族,满足基本前提;
  2. \(H_0\)为真时,\(\overline{X} \sim N\left( \mu_0, \frac{\sigma_0^2}{n} \right)\),正态分布是对称分布,因此\(\overline{X}\)的分布关于\(\mu_0\)严格对称,完全满足定理6.4.5的对称条件。

因此,该检验问题的水平\(\alpha\)的UMPUT存在,且具有对称的检验函数形式,无需求解两个参数\(k_1,k_2\),仅需确定一个对称阈值\(k\),大幅简化了计算。

步骤2:写出对称形式的检验函数与拒绝域

根据定理6.4.5,直接得到该检验的UMPUT的检验函数:

\[\phi_2(x) = \begin{cases} 1, & |\overline{X} - \mu_0| > k \\ 0, & |\overline{X} - \mu_0| < k \end{cases}\]

对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:

\[R^+ = \left\{ x: |\overline{X} - \mu_0| > k \right\} \]

步骤3:推导定解条件,确定阈值\(k\)

根据定理要求,\(k\)由水平条件\(E_{\mu_0}[\phi_2(X)] = \alpha\)唯一确定,即\(H_0\)为真时,拒绝原假设的概率恰好为检验水平\(\alpha\)

首先,将期望转化为概率形式:

\[E_{\mu_0}[\phi_2(X)] = P_{\mu_0}\left( |\overline{X} - \mu_0| > k \right) = \alpha \]

接下来对不等式做标准化变形,两边同时乘以\(\frac{\sqrt{n}}{\sigma_0}\),可得:

\[\left| \frac{\sqrt{n}(\overline{X} - \mu_0)}{\sigma_0} \right| > \frac{\sqrt{n}k}{\sigma_0} \]

\(U = \frac{\sqrt{n}(\overline{X} - \mu_0)}{\sigma_0}\),当\(H_0\)为真时,\(U \sim N(0,1)\),因此概率可改写为:

\[P\left( |U| > \frac{\sqrt{n}k}{\sigma_0} \right) = \alpha \]

根据标准正态分布的对称性,\(P(|U|>c)=\alpha\)等价于\(P(U>c)=\frac{\alpha}{2}\),结合分位数的定义,\(c\)就是标准正态分布的上\(\alpha/2\)分位数\(z_{1-\alpha/2}\),即:

\[\frac{\sqrt{n}k}{\sigma_0} = z_{1-\alpha/2} \]

求解得到阈值\(k\)的闭式解:

\[k = \frac{\sigma_0}{\sqrt{n}} z_{1-\alpha/2} \]

步骤4:写出最终的检验函数与实用拒绝域

我们引入检验统计量\(U(x) = \frac{\sqrt{n}(\overline{x} - \mu_0)}{\sigma_0}\)(即Z统计量),将\(k\)代入检验函数,得到最终的标准化形式:

\[\phi_2(x) = \begin{cases} 1, & |U(x)| > z_{1-\alpha/2} \\ 0, & |U(x)| < z_{1-\alpha/2} \end{cases}\]

对应的实用否定域(拒绝域)为:

\[R^+ = \left\{ x: |U(x)| = \left| \frac{\sqrt{n}(\overline{x} - \mu_0)}{\sigma_0} \right| > z_{1-\alpha/2} \right\} \]

这就是我们经典的Z检验(U检验),是正态总体方差已知时,均值双侧检验的标准方法,同时也是该检验问题下严格的UMPUT,是无偏检验中一致最优的检验,在实际应用中被广泛使用。


四、知识点归纳总结表

检验类型 区间原假设双边检验(UMPUT) 点原假设双边检验(Z检验/U检验,UMPUT)
检验问题 \(H_0: \mu_1 \leq \mu \leq \mu_2\)
\(H_1: \mu < \mu_1\)\(\mu > \mu_2\)
\(\sigma=\sigma_0\)已知)
\(H_0: \mu = \mu_0\)
\(H_1: \mu \neq \mu_0\)
\(\sigma=\sigma_0\)已知)
核心充分统计量 \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\) \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\)
核心分布 \(\overline{X} \sim N\left( \mu, \frac{\sigma_0^2}{n} \right)\),标准化后\(\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0} \sim N(0,1)\) \(\overline{X} \sim N\left( \mu, \frac{\sigma_0^2}{n} \right)\),标准化后\(U = \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} \sim N(0,1)\)\(H_0\)为真时)
检验函数形式 \(\phi_2(x) = \begin{cases} 1, & \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \\ 0, & k_1 \leq \overline{X} \leq k_2 \end{cases}\) $\phi_2(x) = \begin{cases} 1, &
拒绝域(否定域) \(R^+ = \left\{ \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \right\}\) $R^+ = \left{ \left
定解条件 联立方程组:
\(\begin{cases} \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_1)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_1)}{\sigma_0} \right) = 1 - \alpha \\ \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_2)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_2)}{\sigma_0} \right) = 1 - \alpha \end{cases}\)
闭式解:阈值为标准正态上\(\alpha/2\)分位数\(z_{1-\alpha/2}\),满足$P(
检验最优性 水平\(\alpha\)下的一致最优无偏检验(UMPUT) 水平\(\alpha\)下的一致最优无偏检验(UMPUT)
应用场景 理论研究,验证均值是否超出指定区间,实际应用较少 实际工程、统计分析、质量检测中最常用的正态总体均值双侧检验,应用极广

五、最终总结

  1. 本次讲解的两类检验,核心前提都是正态总体方差\(\sigma\)已知,核心统计量都是样本均值\(\overline{X}\),核心分布是正态分布与标准正态分布,这是整个知识点的核心主线。
  2. 区间原假设的双边检验,存在UMPUT,但需要联立方程求解阈值,计算复杂,多用于理论研究;点原假设的双边检验,因正态分布的对称性,可得到对称形式的UMPUT,其标准化后的Z检验形式计算简便,是实际应用中均值检验的标准方法。
  3. 大家要重点区分两个核心场景:
    • 方差\(\sigma\)已知时,均值的双侧检验用Z检验(U检验),使用标准正态分布分位数\(z_{1-\alpha/2}\)
    • 后续我们会学到方差\(\sigma\)未知时,需要用样本方差代替总体方差,此时检验统计量服从t分布,使用t检验,这是两个知识点最核心的区别,一定要记牢。
  4. 这部分内容和上一节方差检验的内容,共同构成了正态分布单参数双边检验的完整体系,核心逻辑都是:通过指数族分布确定检验的最优形式,利用统计量的抽样分布推导定解条件,最终得到实用的检验方法。

一、题目最终结论

在检验水平\(\alpha=0.05\)下,拒绝原假设\(H_0\),即认为设备维修后铁水含碳量与正常水平有显著差异,生产情况不正常。


二、详细解题步骤与原理解析

本题是正态总体方差已知时,总体均值的双侧Z检验(U检验),是我们上一节讲解的6.4.29式检验方法的经典应用,完整解题流程如下:

步骤1:明确问题背景,建立检验假设

  • 正常生产时,铁水含碳量服从正态分布\(N(\mu_0, \sigma_0^2)=N(4.55, 0.108^2)\),维修后方差不变(\(\sigma=\sigma_0=0.108\)已知),需检验均值是否仍为正常水平。
  • 原假设\(H_0: \mu=4.55\)(生产正常,均值无显著差异)
  • 备择假设\(H_1: \mu \neq 4.55\)(生产异常,均值有显著差异)
  • 检验水平\(\alpha=0.05\),样本量\(n=5\)

步骤2:确定检验统计量

由于总体服从正态分布、总体方差\(\sigma_0\)已知,因此使用Z(U)检验统计量,公式为:

\[U = \frac{\sqrt{n}(\overline{X} - \mu_0)}{\sigma_0} \]

当原假设\(H_0\)为真时,\(U \sim N(0,1)\)(标准正态分布),这是本次检验的核心理论依据。

步骤3:计算样本统计量

样本观测值:4.29, 4.39, 4.45, 4.52, 4.54

  1. 计算样本均值\(\overline{x}\)

\[\overline{x} = \frac{4.29 + 4.39 + 4.45 + 4.52 + 4.54}{5} = \frac{22.19}{5} = 4.438 \]

  1. 计算均值偏差:

\[|\overline{x} - \mu_0| = |4.438 - 4.55| = 0.112 \]

  1. 计算检验统计量的观测值:

\[|U(x)| = \frac{\sqrt{n} \cdot |\overline{x} - \mu_0|}{\sigma_0} = \frac{\sqrt{5} \times 0.112}{0.108} \approx \frac{2.236 \times 0.112}{0.108} \approx 2.319 \]

步骤4:确定临界值,做出决策

双侧检验的临界值为标准正态分布的上\(\alpha/2\)分位数\(z_{1-\alpha/2}\)

  • 代入\(\alpha=0.05\),得\(z_{1-0.05/2}=z_{0.975}=1.96\)(标准正态分布常用临界值)
  • 比较检验统计量与临界值:\(|U(x)|=2.319 > 1.96\),检验统计量落在拒绝域内

因此拒绝原假设\(H_0\),认为设备维修后生产情况不正常。

步骤5:p值计算与解读

p值是原假设为真时,出现当前观测结果或更极端结果的概率,是检验结果显著性的补充判断依据:

  • 双侧Z检验的p值公式:\(p = 2 \cdot P(Z > |U(x)|)\),其中\(Z \sim N(0,1)\)
  • 代入\(|U(x)|=2.319\),查标准正态分布表得\(\Phi(2.319) \approx 0.9898\),因此\(P(Z>2.319)=1-0.9898=0.0102\)
  • 最终p值:\(p \approx 2 \times 0.0102 \approx 0.02\)

p值解读:\(p \approx 0.02 < \alpha=0.05\),与临界值法结论一致,且p值越小,拒绝原假设的证据越充分,本次检验有较强的证据证明生产异常。


三、核心知识点补充

  1. 检验前提:该方法仅适用于总体服从正态分布、总体方差已知的场景;若总体方差未知,需改用t检验。
  2. 最优性:该检验是该问题下水平\(\alpha\)的一致最优无偏检验(UMPUT),是无偏检验中功效最优的方法。
  3. 双侧检验与单侧检验的区别:双侧检验的拒绝域分布在标准正态分布的两侧,各占\(\alpha/2\),临界值为\(z_{1-\alpha/2}\);单侧检验的拒绝域仅在一侧,临界值为\(z_{1-\alpha}\),需根据研究问题选择。

posted on 2026-03-03 07:47  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航