6.4.3正态分布单参数的双边假设检验
正态分布(μ已知)下方差σ的双边假设检验 详细讲解与推导
各位同学,今天我们用一整节课的时间,把正态总体均值μ已知时,方差σ的两类双边假设检验讲透。我从事数理统计教学与研究多年,这个知识点是参数假设检验的核心内容之一,也是理解一致最优检验(UMPT)、一致最优无偏检验(UMPUT)的经典案例,我们从基础铺垫、定理依据、逐式推导、实际意义四个维度,把这个知识点拆解得明明白白。
一、前置基础知识铺垫
在正式推导前,我们先把所有用到的基础概念、定理、分布性质讲清楚,这是后续所有推导的根基。
1. 样本与分布前提
我们的研究对象是:独立同分布的样本 \(X_1,X_2,\dots,X_n\),且 \(X_i \sim N(\mu_0,\sigma^2)\),其中均值\(\mu=\mu_0\)是已知常数,方差\(\sigma>0\)是我们要检验的未知参数。
核心分布性质:
对每个样本,标准化后 \(\frac{X_i - \mu_0}{\sigma} \sim N(0,1)\),且相互独立;根据卡方分布的定义,独立标准正态变量的平方和服从卡方分布,因此:
其中 \(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\) 是我们的核心充分统计量,这个分布性质是后续所有概率计算、定解条件推导的核心。
2. 单参数指数族分布
我们先写出样本的联合概率密度函数:
令参数 \(\theta = -\frac{1}{2\sigma^2}\),则密度可改写为单参数指数族的标准形式:
其中:
- \(C(\theta)=(2\pi)^{-n/2} (-2\theta)^{n/2}\),\(Q(\theta)=\theta\)(\(\theta\)是\(\sigma\)的严格单调递增函数)
- 充分统计量 \(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\),\(h(x)\equiv1\)
这说明:该分布族是关于\(T(X)\)的单参数指数族,且\(T(X)\)的分布是连续分布(卡方分布为连续分布),完全满足我们后续用到的UMPT、UMPUT存在性定理的前提条件。
3. 假设检验核心概念
- 检验函数\(\phi(x)\):样本的函数,取值在\([0,1]\),表示当观测到样本\(x\)时,拒绝原假设\(H_0\)的概率。非随机化检验中,\(\phi(x)\)仅取0和1:\(\phi(x)=1\)表示拒绝\(H_0\),\(\phi(x)=0\)表示接受\(H_0\)。
- 否定域(拒绝域)\(R^+\):\(\phi(x)=1\)对应的所有样本\(x\)的集合,即拒绝原假设的样本观测值的范围。
- 第一类错误与检验水平\(\alpha\):\(H_0\)为真时拒绝\(H_0\)的概率,即\(E_{\theta \in \Theta_0}[\phi(X)] = P(\text{拒绝}H_0 | H_0\text{为真})\),检验水平\(\alpha\)要求该概率不超过\(\alpha\),即\(\sup_{\theta \in \Theta_0} E_\theta[\phi(X)] \leq \alpha\)。
- UMPT(一致最优检验):在所有水平为\(\alpha\)的检验中,对备择假设\(\Theta_1\)下的所有参数,功效(\(1-\)第二类错误概率)都达到最大的检验,是假设检验中最优的检验。
- UMPUT(一致最优无偏检验):当UMPT不存在时,我们约束检验为无偏检验(备择假设下的功效不低于水平\(\alpha\),即\(E_{\theta \in \Theta_1}[\phi(X)] \geq \alpha\)),在所有无偏检验中一致最优的检验,就是UMPUT。
4. 核心定理依据
我们本次推导完全基于两个单参数指数族的检验定理,先明确定理内容:
定理6.4.2(双边区间假设的UMPT存在性)
对单参数指数族分布,\(Q(\theta)\)为\(\theta\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对检验问题:
水平为\(\alpha\)的UMPT存在,检验函数形式为:
其中\(k_1,k_2\)由定解条件 \(E_{\theta_1}[\phi(X)] = \alpha\)、\(E_{\theta_2}[\phi(X)] = \alpha\) 唯一确定。
定理6.4.4(点假设双边检验的UMPUT存在性)
对单参数指数族分布,\(Q(\theta)\)为\(\theta\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对双边检验问题:
水平为\(\alpha\)的UMPUT存在,检验函数形式为:
其中\(k_1,k_2\)由两个定解条件唯一确定:
- 水平条件:\(E_{\theta_0}[\phi(X)] = \alpha\)
- 无偏性条件:\(E_{\theta_0}[\phi(X)T(X)] = \alpha E_{\theta_0}[T(X)]\)
二、检验问题(i):\(H_0: \sigma \leq \sigma_1 \text{ 或 } \sigma \geq \sigma_2 \longleftrightarrow H_1: \sigma_1 < \sigma < \sigma_2\)(\(\mu=\mu_0\)已知)
这个检验问题是要判断方差是否落在区间\((\sigma_1,\sigma_2)\)内,是典型的区间原假设的双边检验,我们一步步推导。
步骤1:参数映射,匹配定理形式
我们的参数是\(\sigma>0\),令\(\theta = -\frac{1}{2\sigma^2}\),则\(\theta\)与\(\sigma\)是严格单调递增的一一对应关系:
- \(\sigma \leq \sigma_1 \iff \theta = -\frac{1}{2\sigma^2} \leq -\frac{1}{2\sigma_1^2} = \theta_1\)
- \(\sigma \geq \sigma_2 \iff \theta = -\frac{1}{2\sigma^2} \geq -\frac{1}{2\sigma_2^2} = \theta_2\)
因此原假设与备择假设可等价改写为:
完全匹配定理6.4.2的检验问题形式,且满足指数族、\(T(X)\)分布连续的前提,因此水平为\(\alpha\)的UMPT存在。
步骤2:写出检验函数与否定域
根据定理6.4.2,直接得到该检验的UMPT的检验函数:
其中\(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\)。
否定域(拒绝域)是\(\phi_1(x)=1\)的样本集合,即:
(连续分布下,等号与不等号不影响概率计算,因此也可写为开区间形式)
步骤3:推导定解条件,确定\(k_1,k_2\)
根据定理6.4.2,\(k_1,k_2\)需要满足:在原假设的两个边界点\(\sigma=\sigma_1\)和\(\sigma=\sigma_2\)处,第一类错误概率恰好为\(\alpha\),即:
由于\(\phi_1(X)\)是示性函数,期望等价于概率,因此:
利用我们的核心分布性质\(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\),对不等式两边同时除以\(\sigma^2\),做标准化变形:
对\(\sigma=\sigma_1\):
即
对\(\sigma=\sigma_2\):
即
用卡方分布的概率密度函数\(\chi^2(n,y)\)(自由度为\(n\)的卡方分布pdf)的积分形式表示,得到关于\(k_1,k_2\)的方程组:
联立求解该方程组,即可得到\(k_1,k_2\)的唯一解,从而确定检验函数与拒绝域。
补充说明
该检验是严格的UMPT,是该检验问题下的最优检验,但由于卡方分布的积分无闭式解析解,\(k_1,k_2\)需要通过数值方法求解,计算复杂度高,因此实际应用中较少使用,更多是理论层面的最优性意义。
三、检验问题(ii):\(H_0: \sigma = \sigma_0 \longleftrightarrow H_1: \sigma \neq \sigma_0\)(\(\mu=\mu_0\)已知)
这个检验是我们实际应用中最常用的方差双侧检验,即判断总体方差是否等于给定值\(\sigma_0\),我们同样一步步推导。
步骤1:匹配定理形式
同样令\(\theta = -\frac{1}{2\sigma^2}\),则原假设与备择假设等价于:
完全匹配定理6.4.4的双边点假设检验形式,满足指数族、\(T(X)\)分布连续的前提,因此水平为\(\alpha\)的UMPUT存在。
步骤2:写出检验函数与否定域
根据定理6.4.4,直接得到该检验的UMPUT的检验函数:
其中\(T(x)=\sum_{i=1}^n (x_i - \mu_0)^2\)。
对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:
步骤3:推导定解条件,确定\(k_1,k_2\)
根据定理6.4.4,\(k_1,k_2\)需要满足两个条件:水平条件(a)和无偏性条件(b),我们分别推导。
条件(a):水平条件\(E_{\sigma_0}[\phi_2(X)] = \alpha\)
\(\phi_2(X)\)是示性函数,期望等价于概率:
根据对立事件的概率公式,可得:
同样利用核心分布性质\(\frac{T(X)}{\sigma_0^2} \sim \chi^2(n)\),不等式两边除以\(\sigma_0^2\),变形为:
即
用积分形式表示,得到第一个方程:
条件(b):无偏性条件\(E_{\sigma_0}[\phi_2(X)T(X)] = \alpha E_{\sigma_0}[T(X)]\)
首先计算\(E_{\sigma_0}[T(X)]\):
\(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\),每个\((X_i - \mu_0)^2\)的期望为\(E[(X_i - \mu_0)^2] = \text{Var}(X_i) = \sigma_0^2\),因此:
代入无偏性条件,右边为\(\alpha \cdot n\sigma_0^2 = n\alpha \sigma_0^2\),因此条件(b)可写为:
我们对式子做等价变形:两边同时减去\(E_{\sigma_0}[T(X)]\),得:
消去负号后得到:
根据\(\phi_2(X)\)的定义,\(1 - \phi_2(X)\)是事件\(\{k_1 \leq T(X) \leq k_2\}\)的示性函数,因此:
接下来做变量替换:令\(Y = \frac{T(X)}{\sigma_0^2}\),则\(T(X) = Y \sigma_0^2\),且\(Y \sim \chi^2(n)\),代入上式:
两边同时除以\(\sigma_0^2\),化简得:
用积分形式表示,得到第二个方程:
联立方程(6.4.26)和(6.4.27),即可唯一解出\(k_1,k_2\),得到严格的UMPUT。
步骤4:实际应用的等尾近似解
精确求解上述方程组需要复杂的数值计算,实际应用中我们采用等尾分位数近似,该方法计算简便,且大样本下近似效果极佳,也是我们教材中最终给出的实用形式。
等尾近似的核心思想:让卡方分布的左右两侧尾部概率各为\(\alpha/2\),即:
根据卡方分布分位数的定义:\(\chi^2(n,p)\)表示自由度为\(n\)的卡方分布的\(p\)分位数,即\(P(\chi^2(n) \leq \chi^2(n,p))=p\),因此:
由此得到\(k_1,k_2\)的近似解:
将其代入拒绝域,得到最终的近似否定域:
补充说明
- 该近似解严格满足水平条件\(E_{\sigma_0}[\phi_2(X)]=\alpha\),仅不严格满足无偏性条件,但样本量\(n\)较大时,与精确UMPUT的差异极小,是实际应用中通用的方差双侧检验方法。
- 该检验就是我们常说的卡方检验(\(\chi^2\)检验),是正态总体方差检验的标准方法。
四、知识点归纳总结表
| 检验类型 | 区间原假设双边检验(UMPT) | 点原假设双边检验(UMPUT) |
|---|---|---|
| 检验问题 | \(H_0: \sigma \leq \sigma_1\) 或 \(\sigma \geq \sigma_2\) \(H_1: \sigma_1 < \sigma < \sigma_2\) (\(\mu=\mu_0\)已知) |
\(H_0: \sigma = \sigma_0\) \(H_1: \sigma \neq \sigma_0\) (\(\mu=\mu_0\)已知) |
| 核心充分统计量 | \(T(X) = \sum_{i=1}^n (X_i - \mu_0)^2\) | \(T(X) = \sum_{i=1}^n (X_i - \mu_0)^2\) |
| 核心分布 | \(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\) | \(\frac{T(X)}{\sigma^2} \sim \chi^2(n)\) |
| 检验函数形式 | \(\phi_1(x) = \begin{cases} 1, & k_1 \leq T(x) \leq k_2 \\ 0, & T(x) < k_1 \text{ 或 } T(x) > k_2 \end{cases}\) | \(\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ 0, & k_1 \leq T(x) \leq k_2 \end{cases}\) |
| 拒绝域(否定域) | \(R^+ = \left\{ k_1 \leq \sum_{i=1}^n (x_i - \mu_0)^2 \leq k_2 \right\}\) | 精确形式:\(R^+ = \left\{ \sum_{i=1}^n (x_i - \mu_0)^2 < k_1 \text{ 或 } > k_2 \right\}\) 近似实用形式:\(R^+ = \left\{ \frac{T(x)}{\sigma_0^2} < \chi^2(n,\alpha/2) \text{ 或 } \frac{T(x)}{\sigma_0^2} > \chi^2(n,1-\alpha/2) \right\}\) |
| 定解条件 | 联立方程组: \(\begin{cases} \displaystyle \int_{\frac{k_1}{\sigma_1^2}}^{\frac{k_2}{\sigma_1^2}} \chi^2(n,y) dy = \alpha \\ \displaystyle \int_{\frac{k_1}{\sigma_2^2}}^{\frac{k_2}{\sigma_2^2}} \chi^2(n,y) dy = \alpha \end{cases}\) |
精确解联立方程组: \(\begin{cases} \displaystyle \int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} \chi^2(n,y) dy = 1 - \alpha \\ \displaystyle \int_{\frac{k_1}{\sigma_0^2}}^{\frac{k_2}{\sigma_0^2}} y \cdot \chi^2(n,y) dy = n(1 - \alpha) \end{cases}\) 近似解:等尾分位数\(\chi^2(n,\alpha/2)\)、\(\chi^2(n,1-\alpha/2)\) |
| 检验最优性 | 水平\(\alpha\)下的一致最优检验(UMPT) | 水平\(\alpha\)下的一致最优无偏检验(UMPUT) |
| 应用场景 | 理论研究,验证方差是否落在指定区间,实际应用较少 | 实际工程、统计分析中最常用的正态总体方差双侧检验,应用广泛 |
五、最终总结
- 本次讲解的两类检验,核心前提都是正态总体均值\(\mu\)已知,核心统计量都是离均差平方和\(T(X)=\sum_{i=1}^n (X_i - \mu_0)^2\),核心分布都是自由度为\(n\)的卡方分布,这是整个知识点的核心主线。
- 区间原假设的双边检验,存在严格的UMPT,是理论上的最优检验,但计算复杂,实际应用受限;点原假设的双边检验,不存在UMPT,但存在UMPUT,其等尾近似解计算简便,是实际中方差检验的标准方法。
- 大家要注意区分:\(\mu\)已知时,卡方分布的自由度是\(n\);后续我们会学到\(\mu\)未知时,需要用样本均值代替总体均值,自由度会变为\(n-1\),这是两个知识点最核心的区别,大家一定要记牢。
正态分布(σ已知)下均值μ的双边假设检验 详细讲解与推导
各位同学,我们今天接续上一节课的内容,完整讲解正态总体方差σ已知时,均值μ的两类双边假设检验。这部分内容是参数检验的核心基础,也是大家熟知的Z检验(U检验)的理论来源,我会从定理依据、逐式推导、分布性质、实际意义四个维度,把这个知识点讲透彻,和上一节方差检验的内容形成完整的知识体系。
一、前置基础知识铺垫
在正式推导前,我们先把所有用到的基础概念、定理、分布性质明确下来,确保后续推导的严谨性。
1. 样本与核心分布前提
我们的研究对象是:独立同分布的样本 \(X_1,X_2,\dots,X_n\),且 \(X_i \sim N(\mu,\sigma_0^2)\),其中方差\(\sigma=\sigma_0\)是已知常数,均值\(\mu \in \mathbb{R}\)是我们要检验的未知参数。
核心分布性质:
正态分布的线性组合仍服从正态分布,因此样本均值 \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\) 的分布为:
对其做标准化,可得我们后续推导的核心统计量:
其中\(N(0,1)\)为标准正态分布,其分布函数记为\(\Phi(z) = P(N(0,1) \leq z)\),这是我们所有概率计算的基础。
2. 单参数指数族分布
我们先写出样本的联合概率密度函数,验证其指数族形式:
整理为单参数指数族的标准形式 \(f(x;\mu) = C(\mu) \exp\left\{ Q(\mu) T(x) \right\} h(x)\),其中:
- \(Q(\mu) = \frac{\mu}{\sigma_0^2}\),是\(\mu\)的严格单调递增函数;
- 充分统计量 \(T(x) = \sum_{i=1}^n x_i = n\overline{X}\),因此\(\overline{X}\)也是等价的充分统计量(一一对应变换);
- \(h(x) = \exp\left\{ -\frac{\sum_{i=1}^n x_i^2}{2\sigma_0^2} \right\}\),与参数\(\mu\)无关。
这说明:该分布族是关于\(T=\overline{X}\)的单参数指数族,且\(\overline{X}\)的分布为连续的正态分布,完全满足UMPUT存在性定理的前提条件。
3. 核心定理依据
本次推导完全基于两个单参数指数族的双边检验定理,先明确定理内容:
定理6.4.3(区间原假设双边检验的UMPUT存在性)
对单参数指数族分布,\(Q(\mu)\)为\(\mu\)的严格单调函数,且充分统计量\(T(X)\)的分布连续。针对检验问题:
水平为\(\alpha\)的一致最优无偏检验(UMPUT)存在,检验函数形式为:
其中\(k_1,k_2\)由定解条件 \(E_{\mu_1}[\phi(X)] = \alpha\)、\(E_{\mu_2}[\phi(X)] = \alpha\) 唯一确定。
定理6.4.5(点原假设对称双边检验的UMPUT存在性)
对单参数指数族分布,针对双边检验问题:
若充分统计量\(T(X)\)的分布关于\(\mu_0\)对称,则水平为\(\alpha\)的UMPUT存在,且具有对称的检验函数形式:
其中\(k\)由水平条件 \(E_{\mu_0}[\phi(X)] = \alpha\) 唯一确定。
4. 标准正态分布分位数定义
我们用\(z_p\)表示标准正态分布的\(p\)分位数,即\(\Phi(z_p) = P(N(0,1) \leq z_p) = p\);
常用的上\(\alpha/2\)分位数记为\(z_{1-\alpha/2}\),满足\(\Phi(z_{1-\alpha/2}) = 1 - \frac{\alpha}{2}\),即\(P(N(0,1) > z_{1-\alpha/2}) = \frac{\alpha}{2}\),由对称性可得\(P(N(0,1) < -z_{1-\alpha/2}) = \frac{\alpha}{2}\),因此\(P(|N(0,1)| > z_{1-\alpha/2}) = \alpha\),这是我们后续简化计算的核心性质。
二、检验问题(i):\(H_0: \mu_1 \leq \mu \leq \mu_2 \longleftrightarrow H_1: \mu < \mu_1 \text{ 或 } \mu > \mu_2\)(\(\sigma=\sigma_0\)已知)
这个检验问题是要判断总体均值是否落在指定区间\([\mu_1,\mu_2]\)之外,是区间原假设的双边检验,我们一步步完成推导。
步骤1:匹配定理适用条件
该检验问题完全匹配定理6.4.3的形式:原假设为参数的区间约束,备择假设为区间外的双边区域;同时分布族是关于\(\overline{X}\)的单参数指数族,\(\overline{X}\)的分布连续,因此水平为\(\alpha\)的UMPUT存在。
步骤2:写出检验函数与拒绝域
根据定理6.4.3,以充分统计量\(\overline{X}\)为检验统计量,直接得到该检验的UMPUT的检验函数:
对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:
步骤3:推导定解条件,确定\(k_1,k_2\)
根据定理6.4.3,\(k_1,k_2\)需要满足:在原假设的两个边界点\(\mu=\mu_1\)和\(\mu=\mu_2\)处,第一类错误概率恰好为检验水平\(\alpha\),即:
由于\(\phi_2(X)\)是示性函数,期望等价于拒绝原假设的概率,因此:
根据对立事件的概率公式,上式可等价改写为:
接下来利用正态分布的标准化性质,对不等式做变形:
已知当\(\mu=\mu_i\)时,\(\frac{\sqrt{n}(\overline{X} - \mu_i)}{\sigma_0} \sim N(0,1)\),对不等式\(k_1 \leq \overline{X} \leq k_2\)的三项同时减去\(\mu_i\),乘以\(\frac{\sqrt{n}}{\sigma_0}\),可得:
该不等式中间的变量服从标准正态分布,因此概率可通过标准正态分布函数\(\Phi(\cdot)\)表示,得到:
由此得到关于\(k_1,k_2\)的联立方程组:
联立求解该方程组,即可得到\(k_1,k_2\)的唯一解,从而确定检验函数与拒绝域。
补充说明
该检验是该问题下水平\(\alpha\)的UMPUT,是无偏检验中的最优检验,但由于标准正态分布函数无闭式解析解,\(k_1,k_2\)需要通过数值方法或正态分布表迭代求解,计算复杂度较高,因此更多用于理论研究,实际工程应用中较少使用。
三、检验问题(ii):\(H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu \neq \mu_0\)(\(\sigma=\sigma_0\)已知)
这个检验是我们实际应用中最常用的正态总体均值双侧Z检验(U检验),用于判断总体均值是否等于给定的目标值\(\mu_0\),我们完成完整推导。
步骤1:匹配定理适用条件
该检验问题是点原假设的双边检验,完全匹配定理6.4.5的适用场景:
- 分布族是关于\(\overline{X}\)的单参数指数族,满足基本前提;
- 当\(H_0\)为真时,\(\overline{X} \sim N\left( \mu_0, \frac{\sigma_0^2}{n} \right)\),正态分布是对称分布,因此\(\overline{X}\)的分布关于\(\mu_0\)严格对称,完全满足定理6.4.5的对称条件。
因此,该检验问题的水平\(\alpha\)的UMPUT存在,且具有对称的检验函数形式,无需求解两个参数\(k_1,k_2\),仅需确定一个对称阈值\(k\),大幅简化了计算。
步骤2:写出对称形式的检验函数与拒绝域
根据定理6.4.5,直接得到该检验的UMPUT的检验函数:
对应的否定域(拒绝域)是\(\phi_2(x)=1\)的样本集合,即:
步骤3:推导定解条件,确定阈值\(k\)
根据定理要求,\(k\)由水平条件\(E_{\mu_0}[\phi_2(X)] = \alpha\)唯一确定,即\(H_0\)为真时,拒绝原假设的概率恰好为检验水平\(\alpha\)。
首先,将期望转化为概率形式:
接下来对不等式做标准化变形,两边同时乘以\(\frac{\sqrt{n}}{\sigma_0}\),可得:
令\(U = \frac{\sqrt{n}(\overline{X} - \mu_0)}{\sigma_0}\),当\(H_0\)为真时,\(U \sim N(0,1)\),因此概率可改写为:
根据标准正态分布的对称性,\(P(|U|>c)=\alpha\)等价于\(P(U>c)=\frac{\alpha}{2}\),结合分位数的定义,\(c\)就是标准正态分布的上\(\alpha/2\)分位数\(z_{1-\alpha/2}\),即:
求解得到阈值\(k\)的闭式解:
步骤4:写出最终的检验函数与实用拒绝域
我们引入检验统计量\(U(x) = \frac{\sqrt{n}(\overline{x} - \mu_0)}{\sigma_0}\)(即Z统计量),将\(k\)代入检验函数,得到最终的标准化形式:
对应的实用否定域(拒绝域)为:
这就是我们经典的Z检验(U检验),是正态总体方差已知时,均值双侧检验的标准方法,同时也是该检验问题下严格的UMPUT,是无偏检验中一致最优的检验,在实际应用中被广泛使用。
四、知识点归纳总结表
| 检验类型 | 区间原假设双边检验(UMPUT) | 点原假设双边检验(Z检验/U检验,UMPUT) |
|---|---|---|
| 检验问题 | \(H_0: \mu_1 \leq \mu \leq \mu_2\) \(H_1: \mu < \mu_1\) 或 \(\mu > \mu_2\) (\(\sigma=\sigma_0\)已知) |
\(H_0: \mu = \mu_0\) \(H_1: \mu \neq \mu_0\) (\(\sigma=\sigma_0\)已知) |
| 核心充分统计量 | \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\) | \(\overline{X} = \frac{1}{n}\sum_{i=1}^n X_i\) |
| 核心分布 | \(\overline{X} \sim N\left( \mu, \frac{\sigma_0^2}{n} \right)\),标准化后\(\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma_0} \sim N(0,1)\) | \(\overline{X} \sim N\left( \mu, \frac{\sigma_0^2}{n} \right)\),标准化后\(U = \frac{\sqrt{n}(\overline{X}-\mu_0)}{\sigma_0} \sim N(0,1)\)(\(H_0\)为真时) |
| 检验函数形式 | \(\phi_2(x) = \begin{cases} 1, & \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \\ 0, & k_1 \leq \overline{X} \leq k_2 \end{cases}\) | $\phi_2(x) = \begin{cases} 1, & |
| 拒绝域(否定域) | \(R^+ = \left\{ \overline{X} < k_1 \text{ 或 } \overline{X} > k_2 \right\}\) | $R^+ = \left{ \left |
| 定解条件 | 联立方程组: \(\begin{cases} \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_1)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_1)}{\sigma_0} \right) = 1 - \alpha \\ \displaystyle \Phi\left( \frac{\sqrt{n}(k_2 - \mu_2)}{\sigma_0} \right) - \Phi\left( \frac{\sqrt{n}(k_1 - \mu_2)}{\sigma_0} \right) = 1 - \alpha \end{cases}\) |
闭式解:阈值为标准正态上\(\alpha/2\)分位数\(z_{1-\alpha/2}\),满足$P( |
| 检验最优性 | 水平\(\alpha\)下的一致最优无偏检验(UMPUT) | 水平\(\alpha\)下的一致最优无偏检验(UMPUT) |
| 应用场景 | 理论研究,验证均值是否超出指定区间,实际应用较少 | 实际工程、统计分析、质量检测中最常用的正态总体均值双侧检验,应用极广 |
五、最终总结
- 本次讲解的两类检验,核心前提都是正态总体方差\(\sigma\)已知,核心统计量都是样本均值\(\overline{X}\),核心分布是正态分布与标准正态分布,这是整个知识点的核心主线。
- 区间原假设的双边检验,存在UMPUT,但需要联立方程求解阈值,计算复杂,多用于理论研究;点原假设的双边检验,因正态分布的对称性,可得到对称形式的UMPUT,其标准化后的Z检验形式计算简便,是实际应用中均值检验的标准方法。
- 大家要重点区分两个核心场景:
- 方差\(\sigma\)已知时,均值的双侧检验用Z检验(U检验),使用标准正态分布分位数\(z_{1-\alpha/2}\);
- 后续我们会学到方差\(\sigma\)未知时,需要用样本方差代替总体方差,此时检验统计量服从t分布,使用t检验,这是两个知识点最核心的区别,一定要记牢。
- 这部分内容和上一节方差检验的内容,共同构成了正态分布单参数双边检验的完整体系,核心逻辑都是:通过指数族分布确定检验的最优形式,利用统计量的抽样分布推导定解条件,最终得到实用的检验方法。
一、题目最终结论
在检验水平\(\alpha=0.05\)下,拒绝原假设\(H_0\),即认为设备维修后铁水含碳量与正常水平有显著差异,生产情况不正常。
二、详细解题步骤与原理解析
本题是正态总体方差已知时,总体均值的双侧Z检验(U检验),是我们上一节讲解的6.4.29式检验方法的经典应用,完整解题流程如下:
步骤1:明确问题背景,建立检验假设
- 正常生产时,铁水含碳量服从正态分布\(N(\mu_0, \sigma_0^2)=N(4.55, 0.108^2)\),维修后方差不变(\(\sigma=\sigma_0=0.108\)已知),需检验均值是否仍为正常水平。
- 原假设\(H_0: \mu=4.55\)(生产正常,均值无显著差异)
- 备择假设\(H_1: \mu \neq 4.55\)(生产异常,均值有显著差异)
- 检验水平\(\alpha=0.05\),样本量\(n=5\)。
步骤2:确定检验统计量
由于总体服从正态分布、总体方差\(\sigma_0\)已知,因此使用Z(U)检验统计量,公式为:
当原假设\(H_0\)为真时,\(U \sim N(0,1)\)(标准正态分布),这是本次检验的核心理论依据。
步骤3:计算样本统计量
样本观测值:4.29, 4.39, 4.45, 4.52, 4.54
- 计算样本均值\(\overline{x}\):
- 计算均值偏差:
- 计算检验统计量的观测值:
步骤4:确定临界值,做出决策
双侧检验的临界值为标准正态分布的上\(\alpha/2\)分位数\(z_{1-\alpha/2}\):
- 代入\(\alpha=0.05\),得\(z_{1-0.05/2}=z_{0.975}=1.96\)(标准正态分布常用临界值)
- 比较检验统计量与临界值:\(|U(x)|=2.319 > 1.96\),检验统计量落在拒绝域内
因此拒绝原假设\(H_0\),认为设备维修后生产情况不正常。
步骤5:p值计算与解读
p值是原假设为真时,出现当前观测结果或更极端结果的概率,是检验结果显著性的补充判断依据:
- 双侧Z检验的p值公式:\(p = 2 \cdot P(Z > |U(x)|)\),其中\(Z \sim N(0,1)\)
- 代入\(|U(x)|=2.319\),查标准正态分布表得\(\Phi(2.319) \approx 0.9898\),因此\(P(Z>2.319)=1-0.9898=0.0102\)
- 最终p值:\(p \approx 2 \times 0.0102 \approx 0.02\)
p值解读:\(p \approx 0.02 < \alpha=0.05\),与临界值法结论一致,且p值越小,拒绝原假设的证据越充分,本次检验有较强的证据证明生产异常。
三、核心知识点补充
- 检验前提:该方法仅适用于总体服从正态分布、总体方差已知的场景;若总体方差未知,需改用t检验。
- 最优性:该检验是该问题下水平\(\alpha\)的一致最优无偏检验(UMPUT),是无偏检验中功效最优的方法。
- 双侧检验与单侧检验的区别:双侧检验的拒绝域分布在标准正态分布的两侧,各占\(\alpha/2\),临界值为\(z_{1-\alpha/2}\);单侧检验的拒绝域仅在一侧,临界值为\(z_{1-\alpha}\),需根据研究问题选择。
posted on 2026-03-03 07:47 Indian_Mysore 阅读(0) 评论(0) 收藏 举报
浙公网安备 33010602011771号