6.4单参数指数族分布的双边检验
单参数指数族分布的双边检验 详细讲解与推导证明
我将以多年数理统计教学与研究的视角,从问题起源、核心概念、严格推导到最终总结,完整讲解该知识点,确保逻辑连贯、推导严谨、结论清晰。
一、问题起源:为什么双边检验不能直接用单边的UMPT?
上一节我们已经证明:对于单调似然比分布族,单边假设检验问题存在一致最优检验(UMPT),其核心是单边检验的功效函数是关于参数\(\theta\)的单调函数,能在备择假设的整个参数空间上实现功效一致最优。
但双边检验与单边检验有本质区别:
双边检验的备择假设分布在原假设的两侧,其功效函数无法是单调函数:
- 若备择假设是中间区间(\(H_1:\theta_1<\theta<\theta_2\)),功效函数需要满足「两头小、中间大」;
- 若备择假设是两侧区间(\(H_1:\theta<\theta_1\) 或 \(\theta>\theta_2\)),功效函数需要满足「中间小、两头大」。
单调的单边检验功效函数无法满足上述形态,因此双边检验问题不存在全局的UMPT。我们需要缩小检验的范围,引入「无偏检验」的约束,在无偏检验类中寻找一致最优的检验,即一致最优无偏检验(UMPUT)。
二、双边检验的三类核心问题形式
设总体\(X \sim f(x,\theta), \theta \in \mathbb{R}\),双边检验分为三类标准形式:
- 问题(i) 带内检验:\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\)
- 问题(ii) 带外检验:\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
- 问题(iii) 点原假设双侧检验:\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\)
其中问题(iii)是问题(ii)的特例(令\(\theta_1=\theta_2=\theta_0\)),也是实际应用中最常见的形式。
三、核心概念:无偏检验与UMPUT
3.1 功效函数的核心意义
检验函数\(\phi(x)\)的功效函数定义为:
它表示「当参数为\(\theta\)时,拒绝原假设\(H_0\)的概率」。一个合格的水平为\(\alpha\)的检验,必须满足:
- 在原假设\(H_0\)的参数空间上:\(\beta_\phi(\theta) \leq \alpha\)(第一类错误概率不超过显著性水平\(\alpha\));
- 在备择假设\(H_1\)的参数空间上:\(\beta_\phi(\theta)\)应尽可能大(第二类错误概率\(1-\beta_\phi(\theta)\)尽可能小)。
3.2 无偏检验的定义
一个水平为\(\alpha\)的检验\(\phi(x)\),若满足:在备择假设\(H_1\)上,\(\beta_\phi(\theta) \geq \alpha\),则称\(\phi(x)\)为水平为\(\alpha\)的无偏检验。
定义的合理性
若一个检验在\(H_1\)上的功效小于\(\alpha\),意味着「\(H_1\)成立时拒绝\(H_0\)的概率,比\(H_0\)成立时错误拒绝\(H_0\)的概率还小」,这是完全不合理的,相当于检验对备择假设没有识别能力,是「有偏」的。
所有水平为\(\alpha\)的无偏检验构成的集合,称为无偏检验类,记为:
3.3 一致最优无偏检验(UMPUT)
若检验\(\phi(x) \in \Phi_\alpha^*\),且对任意的\(\tilde{\phi}(x) \in \Phi_\alpha^*\),都有:
则称\(\phi(x)\)为该检验问题的一致最优无偏检验,记为UMPUT。
简单来说,UMPUT就是在所有无偏检验中,在备择假设的全空间上功效都最高的检验,是双边检验问题的最优解。
3.4 无偏检验的关键边界性质
对于指数族分布,其功效函数\(\beta(\theta)\)是关于\(\theta\)的连续可导函数,结合无偏性定义,可得到两个核心边界条件,是后续构造检验的核心约束:
-
对于问题(i)和(ii),无偏检验必须满足:
\[\beta(\theta_1) = \mathbb{E}_{\theta_1}[\phi(X)] = \alpha, \quad \beta(\theta_2) = \mathbb{E}_{\theta_2}[\phi(X)] = \alpha \]证明:由连续性,\(\theta \to \theta_1^+\)(问题(i))或\(\theta \to \theta_1^-\)(问题(ii))时,\(\beta(\theta) \to \beta(\theta_1)\),而无偏性要求\(\beta(\theta) \geq \alpha\),同时\(H_0\)要求\(\beta(\theta_1) \leq \alpha\),因此只能取等号,\(\theta_2\)同理。
-
对于问题(iii),无偏检验必须满足:
\[\beta(\theta_0) = \mathbb{E}_{\theta_0}[\phi(X)] = \alpha, \quad \beta'(\theta_0) = \frac{d}{d\theta}\beta(\theta)\bigg|_{\theta=\theta_0} = 0 \]证明:\(\beta(\theta_0)=\alpha\)的推导同上;而\(\theta_0\)是功效函数的极小值点(中间小、两头大),因此在该点的导数为0。
四、单参数指数族的标准形式
我们的研究对象是单参数指数族分布,其概率密度(分布律)的标准形式为:
其中:
- \(Q(\theta)\)是\(\theta\)的严格单调递增函数(若不满足,可通过参数变换转化为自然参数形式);
- \(T(x)\)是参数\(\theta\)的充分统计量,包含了样本中关于\(\theta\)的所有信息;
- \(h(x) \geq 0\)为支撑函数,\(C(\theta) > 0\)为归一化常数。
为简化推导,引入自然参数\(\eta = Q(\theta)\),则指数族可转化为自然形式:
此时\(\eta\)与\(\theta\)一一对应,假设检验问题可等价转化为关于\(\eta\)的检验,最优检验必然基于充分统计量\(T=T(X)\)构造。
五、三类双边检验的UMPUT推导与证明
5.1 问题(iii):\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\) 的UMPUT
这是最常用的双侧检验,我们先完成其完整推导。
步骤1:转化为自然参数的约束条件
检验问题转化为\(H_0:\eta=\eta_0 \longleftrightarrow H_1:\eta\neq\eta_0\),其中\(\eta_0=Q(\theta_0)\)。
结合无偏检验的边界条件,检验需满足两个约束:
- 水平条件:\(\mathbb{E}_{\eta_0}[\phi(T)] = \alpha\)
- 导数条件:\(\beta'(\eta_0) = 0\)
步骤2:推导功效函数的导数表达式
对于指数族,充分统计量\(T\)的分布仍为指数族,密度为:
功效函数为:
对\(\eta\)求导(指数族满足正则条件,积分与求导可交换):
由密度的归一性\(\int C(\eta) e^{\eta t} h_T(t) dt = 1\),对\(\eta\)求导得:
将其代入导数表达式,化简得核心结论:
因此,导数条件\(\beta'(\eta_0)=0\)等价于:
步骤3:基于广义NP引理构造最优检验
我们的目标是:在满足上述两个约束的检验中,找到对任意\(\eta\neq\eta_0\),\(\beta(\eta)\)最大的检验。
根据广义Neyman-Pearson引理(带多个约束的最优检验构造),对任意固定的\(\eta_1\neq\eta_0\),最大化\(\mathbb{E}_{\eta_1}[\phi(T)]\)的检验,其拒绝域由似然比决定:
该似然比是关于\(t\)的指数函数,而约束条件是线性的,因此方程\(\frac{f(t,\eta_1)}{f(t,\eta_0)} = k_1 + k_2 t\)最多有两个解\(c_1,c_2\)(\(c_1<c_2\))。无论\(\eta_1>\eta_0\)还是\(\eta_1<\eta_0\),不等式的解均为\(t<c_1\)或\(t>c_2\),且该形式与\(\eta_1\)无关,满足「一致最优」的要求。
步骤4:最终的UMPUT形式
问题(iii)的UMPUT为:
其中临界值\(c_1,c_2\)和随机化参数\(\gamma_1,\gamma_2\),由以下两个约束唯一确定:
补充说明:
- 连续分布:\(P(T=c_1)=P(T=c_2)=0\),因此\(\gamma_1=\gamma_2=0\),无需随机化;
- 对称分布:若\(T\)的分布关于\(\mathbb{E}_{\eta_0}[T]\)对称,可直接取\(c_1 = \mathbb{E}[T] - k\),\(c_2 = \mathbb{E}[T] + k\),两个约束可简化为一个,例如正态分布的双侧z检验、t检验。
5.2 问题(ii):\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\) 的UMPUT
步骤1:约束条件
转化为自然参数的检验问题\(H_0:\eta_1\leq\eta\leq\eta_2 \longleftrightarrow H_1:\eta<\eta_1 \text{ 或 } \eta>\eta_2\),无偏检验的约束为边界条件:
步骤2:检验形式与证明
同样通过广义NP引理,对任意\(\eta\notin[\eta_1,\eta_2]\),最优检验的拒绝域为\(t<c_1\)或\(t>c_2\),与\(\eta\)无关,因此是一致最优的。
最终的UMPUT形式与问题(iii)完全一致:
其中\(c_1,c_2,\gamma_1,\gamma_2\)由约束\(\mathbb{E}_{\eta_1}[\phi(T)] = \alpha\)、\(\mathbb{E}_{\eta_2}[\phi(T)] = \alpha\)唯一确定。
最优性证明
- 水平有效性:指数族的功效函数\(\beta(\eta)\)是关于\(\eta\)的凸函数,凸函数在区间\([\eta_1,\eta_2]\)上的最大值在端点取得,因此\(\forall \eta\in[\eta_1,\eta_2]\),\(\beta(\eta)\leq\alpha\),满足水平要求;
- 无偏性:对\(\eta<\eta_1\)或\(\eta>\eta_2\),由凸函数性质,\(\beta(\eta)\geq\alpha\),满足无偏性;
- 一致最优性:对任意无偏检验\(\tilde{\phi}\),其必然满足边界条件,由广义NP引理,\(\phi\)在所有\(\eta\notin[\eta_1,\eta_2]\)上功效最大,因此是UMPUT。
5.3 问题(i):\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\) 的UMPUT
步骤1:约束条件
转化为自然参数的检验问题\(H_0:\eta\leq\eta_1 \text{ 或 } \eta\geq\eta_2 \longleftrightarrow H_1:\eta_1<\eta<\eta_2\),约束仍为边界条件:
步骤2:检验形式
该问题的备择假设是中间区间,因此最优检验的拒绝域为中间区间,接受域为两侧,最终的UMPUT形式为:
其中\(c_1,c_2,\gamma_1,\gamma_2\)由约束\(\mathbb{E}_{\eta_1}[\phi(T)] = \alpha\)、\(\mathbb{E}_{\eta_2}[\phi(T)] = \alpha\)唯一确定。
最优性证明
该问题的功效函数是关于\(\eta\)的凹函数,在区间\((\eta_1,\eta_2)\)内\(\beta(\eta)\geq\alpha\)(满足无偏性),区间外\(\beta(\eta)\leq\alpha\)(满足水平要求),且在区间内的功效一致高于其他无偏检验,因此是UMPUT。
六、核心知识点总结表格
| 检验问题编号 | 原假设 \(H_0\) | 备择假设 \(H_1\) | UMPUT检验函数形式(基于充分统计量\(T=T(X)\)) | 检验的约束条件 | 功效函数核心性质 |
|---|---|---|---|---|---|
| (i) 带内检验 | \(\theta\leq\theta_1\) 或 \(\theta\geq\theta_2\) | \(\theta_1<\theta<\theta_2\) | $$\phi(t)=\begin{cases}1, & c_1<t<c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & t<c_1 \text{ 或 } t>c_2\end{cases}$$ | \(\mathbb{E}_{\theta_1}[\phi(T)]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi(T)]=\alpha\) |
凹函数,「两头小中间大」,在\((\theta_1,\theta_2)\)内\(\beta(\theta)\geq\alpha\),区间外\(\beta(\theta)\leq\alpha\) |
| (ii) 带外检验 | \(\theta_1\leq\theta\leq\theta_2\) | \(\theta<\theta_1\) 或 \(\theta>\theta_2\) | $$\phi(t)=\begin{cases}1, & t<c_1 \text{ 或 } t>c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & c_1<t<c_2\end{cases}$$ | \(\mathbb{E}_{\theta_1}[\phi(T)]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi(T)]=\alpha\) |
凸函数,「中间小两头大」,在\((\theta_1,\theta_2)\)内\(\beta(\theta)\leq\alpha\),区间外\(\beta(\theta)\geq\alpha\) |
| (iii) 点原假设双侧检验 | \(\theta=\theta_0\) | \(\theta\neq\theta_0\) | $$\phi(t)=\begin{cases}1, & t<c_1 \text{ 或 } t>c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & c_1<t<c_2\end{cases}$$ | \(\mathbb{E}_{\theta_0}[\phi(T)]=\alpha\) \(\mathbb{E}_{\theta_0}[\phi(T)T]=\alpha \mathbb{E}_{\theta_0}[T]\)(或\(\beta'(\theta_0)=0\)) |
凸函数,\(\theta_0\)为极小值点,\(\beta(\theta_0)=\alpha\),\(\theta\neq\theta_0\)时\(\beta(\theta)\geq\alpha\) |
七、补充说明与应用实例
- 正态分布双侧z检验:设\(X_1,\dots,X_n \sim N(\mu,\sigma^2)\),\(\sigma^2\)已知,检验\(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\)。充分统计量为\(\bar{X}\),属于指数族,其UMPUT就是经典的双侧z检验,拒绝域为\(|\bar{X}-\mu_0| > z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\),完全符合上述推导的形式。
- 二项分布双侧检验:设\(X \sim Bin(n,p)\),检验\(H_0:p=p_0 \leftrightarrow H_1:p\neq p_0\),属于指数族,其UMPUT的拒绝域为\(X<c_1\)或\(X>c_2\),通过两个约束条件确定临界值与随机化参数,解决离散分布的显著性水平匹配问题。
- 核心结论:单参数指数族的双边检验问题不存在全局UMPT,但在无偏检验类中,一定存在UMPUT,且检验形式均基于充分统计量构造,由无偏性的边界条件唯一确定临界值。
指数族分布双边检验:推广N-P引理与检验(i)的UMPT完整推导
承接上一讲的内容,本部分我们将完整讲解双边检验最优性的核心工具——推广的Neyman-Pearson引理,并基于该引理完成指数族分布下双边检验(i)的UMPT(一致最优检验)的严格推导,明确三类双边检验的最优性差异。
一、推广的Neyman-Pearson引理(定理6.4.1):背景与完整证明
1.1 引理的背景意义
经典的Neyman-Pearson(N-P)引理仅能解决单点原假设↔单点备择假设的最优势检验(MPT)问题,仅含1个第一类错误概率的约束条件。
而双边检验的原假设包含两个参数点(如\(H_0:\theta=\theta_1\)或\(\theta=\theta_2\)),对应2个约束条件,因此必须将N-P引理推广到多约束场景,这是构造双边检验最优检验的核心工具。
1.2 引理的正式表述
设概率密度\(f_i(x),i=1,2,3\)关于测度\(\mu(x)\)可积,检验函数满足\(0\leq\phi(x)\leq1\)(\(\phi(x)\)为观测到\(x\)时拒绝原假设的概率)。
定义两类检验类:
- 等式约束检验类:\(\Phi'_\alpha = \left\{ \phi: \int_{\mathcal{X}} \phi(x)f_i(x)d\mu(x) = \alpha_i, i=1,2 \right\}\)(原假设两点的第一类错误概率严格等于\(\alpha\))
- 不等式约束检验类:\(\Phi_\alpha = \left\{ \phi: \int_{\mathcal{X}} \phi(x)f_i(x)d\mu(x) \leq \alpha_i, i=1,2 \right\}\)(原假设两点的第一类错误概率不超过\(\alpha\))
定义检验函数:
其中\(f_1,f_2\)对应原假设两点的密度,\(f_3\)对应备择假设的密度,\(c_1,c_2\)为拉格朗日常数,\(\gamma\)为随机化参数。
引理的两个核心结论:
- 若存在常数\(c_1,c_2\)(可正可负)和\(\gamma\),使得\(\phi(x) \in \Phi'_\alpha\),则对任意\(\tilde{\phi}(x) \in \Phi'_\alpha\),有\[\int_{\mathcal{X}} \phi(x)f_3(x)d\mu(x) \geq \int_{\mathcal{X}} \tilde{\phi}(x)f_3(x)d\mu(x) \]即\(\phi(x)\)是等式约束下的MPT。
- 若存在常数\(c_1\geq0, c_2\geq0\)和\(\gamma\),使得\(\phi(x) \in \Phi'_\alpha\),则对任意\(\tilde{\phi}(x) \in \Phi_\alpha\),上述不等式仍成立,即\(\phi(x)\)是不等式约束下的MPT。
同时,\(\phi(x)\)在\(R^+ \cup R^-\)上几乎处处唯一。
1.3 完整证明过程
证明核心思路与经典N-P引理一致:通过构造非负差值函数,利用积分的保号性证明功效的最优性。
步骤1:构造非负差值函数
记
分析\(A(x)\)的符号:
- 当\(x \in R^+\):\(f_3 > c_1f_1 + c_2f_2\),且\(\phi(x)=1\)、\(\tilde{\phi}(x)\leq1\),故\(\phi-\tilde{\phi}\geq0\),因此\(A(x)\geq0\);
- 当\(x \in R^-\):\(f_3 < c_1f_1 + c_2f_2\),且\(\phi(x)=0\)、\(\tilde{\phi}(x)\geq0\),故\(\phi-\tilde{\phi}\leq0\),因此\(A(x)\geq0\);
- 当\(x \in R^0\):\(f_3 = c_1f_1 + c_2f_2\),因此\(A(x)=0\)。
综上,对所有\(x\)有\(A(x)\geq0\),因此积分满足:
步骤2:展开积分得到核心不等式
将\(A(x)\)代入积分并展开,移项后得到:
我们将后两项的和称为「余项」,分两种情形讨论余项的符号。
情形1:等式约束\(\phi, \tilde{\phi} \in \Phi'_\alpha\)
此时\(\int \phi f_i d\mu = \int \tilde{\phi} f_i d\mu = \alpha_i\),因此\(\int [\phi - \tilde{\phi}]f_i d\mu = 0\),余项为0,代入(1)式直接得到:
结论(1)得证。
情形2:不等式约束\(\phi \in \Phi'_\alpha, \tilde{\phi} \in \Phi_\alpha\),且\(c_1\geq0,c_2\geq0\)
此时\(\int \phi f_i d\mu = \alpha_i\),\(\int \tilde{\phi} f_i d\mu \leq \alpha_i\),因此\(\int [\phi - \tilde{\phi}]f_i d\mu \geq 0\)。
结合\(c_1\geq0,c_2\geq0\),余项\(\geq0\),代入(1)式仍可得到:
结论(2)得证。
唯一性证明
若\(\tilde{\phi}\)也达到最大功效,则必须有\(A(x)=0\)几乎处处成立。在\(R^+ \cup R^-\)上,\(f_3 - c_1f_1 - c_2f_2 \neq 0\),因此必须有\(\phi(x)=\tilde{\phi}(x)\)几乎处处成立,即\(\phi(x)\)在\(R^+ \cup R^-\)上唯一。
1.4 特例验证
当\(f_1(x)\)不存在时,检验退化为单点原假设的经典N-P问题,此时\(R^+ = \{x:f_3(x)>c_2f_2(x)\}\),与经典N-P引理的检验形式完全一致,验证了推广的合理性。
二、引理6.4.1:指数族下检验(i)'的MPT构造与推导
2.1 检验问题的设定
考虑单参数指数族分布:
其中\(Q(\theta)\)是\(\theta\)的严格增函数,\(T(x)\)是\(\theta\)的充分统计量。
我们研究简单假设检验问题:
目标是找到满足\(E_{\theta_1}[\phi(X)]\leq\alpha\)、\(E_{\theta_2}[\phi(X)]\leq\alpha\)的检验中,最大化\(E_{\theta_3}[\phi(X)]\)的MPT。
2.2 拒绝域的化简
对应推广的N-P引理,\(f_1=f(x,\theta_1),f_2=f(x,\theta_2),f_3=f(x,\theta_3)\),拒绝域为:
将指数族密度代入,两边除以\(h(x)a(\theta_3)e^{Q(\theta_3)T(x)}\)(恒正,不改变不等式方向),令:
由\(\theta_1<\theta_3<\theta_2\)且\(Q(\theta)\)严格递增,得\(b_1>0,b_2>0\)。此时拒绝域等价于:
2.3 \(g(t)\)的性质分析与拒绝域形式确定
我们通过分析\(g(t)\)的符号、单调性、凹凸性,确定拒绝域的形式,核心是排除不符合约束的情形。
情形1:\(d_1\leq0\)且\(d_2\leq0\)
此时\(g(t)\leq0<1\)对所有\(t\)成立,\(R^+=\mathcal{X}\),即\(\phi(x)\equiv1\),此时\(E_{\theta_1}[\phi]=E_{\theta_2}[\phi]=1\),与\(0<\alpha<1\)矛盾,排除。
情形2:\(d_1>0,d_2<0\)(\(d_1<0,d_2>0\)对称)
对\(g(t)\)求一阶导数:
两项均恒负,因此\(g'(t)<0\),\(g(t)\)是严格减函数,\(g(t)<1\)的解为\(t>k\)(单边拒绝域)。
而单边检验的功效函数是\(\theta\)的严格增函数,必有\(\beta(\theta_1)<\beta(\theta_2)\),无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\)的约束,排除。
唯一可行情形:\(d_1\geq0,d_2\geq0\)且不全为0
对\(g(t)\)求二阶导数:
所有项均非负且不全为0,因此\(g''(t)>0\),\(g(t)\)是严格凸函数(开口向上的U型曲线)。
严格凸函数\(g(t)=1\)最多有两个解\(k_1<k_2\),且:
- 当\(k_1<t<k_2\)时,\(g(t)<1\);
- 当\(t<k_1\)或\(t>k_2\)时,\(g(t)>1\)。
因此拒绝域为:
2.4 检验函数的最终形式与最优性
结合拒绝域与随机化检验的要求,检验函数为:
其中\(k_1,k_2,\gamma_{11},\gamma_{12}\)由约束\(E_{\theta_1}[\phi_1(X)]=\alpha\)、\(E_{\theta_2}[\phi_1(X)]=\alpha\)唯一确定。
最优性证明:
由\(d_1\geq0,d_2\geq0\)得\(c_1\geq0,c_2\geq0\),根据推广的N-P引理结论(2),对任意满足\(E_{\theta_1}[\tilde{\phi}]\leq\alpha\)、\(E_{\theta_2}[\tilde{\phi}]\leq\alpha\)的检验\(\tilde{\phi}\),都有\(E_{\theta_3}[\phi_1(X)]\geq E_{\theta_3}[\tilde{\phi}(X)]\),即\(\phi_1(x)\)是检验(i)'的MPT。
2.5 关键推论
上述检验\(\phi_1(x)\)的形式与备择假设的\(\theta_3\)无关,仅由\(\theta_1,\theta_2\)和\(\alpha\)决定。因此\(\phi_1(x)\)不仅是单点备择假设的MPT,更是对整个备择空间\(\theta_1<\theta<\theta_2\)的一致最优检验,即:
\(\phi_1(x)\)是检验问题 \((i)'' \ H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\) 的UMPT。
三、检验(i)的全局UMPT证明
检验(i)的完整形式为:
我们证明上述\(\phi_1(x)\)是该问题的全局UMPT,需验证两个核心条件:
3.1 水平有效性:原假设空间上满足\(E_\theta[\phi_1(X)]\leq\alpha\)
指数族的功效函数\(\beta(\theta)=E_\theta[\phi_1(X)]\)是关于\(\theta\)的连续可导函数,且为先增后减的单峰函数(凹函数),在区间\((\theta_1,\theta_2)\)内取得最大值。
因此:
- 当\(\theta\leq\theta_1\)时,\(\beta(\theta)\leq\beta(\theta_1)=\alpha\);
- 当\(\theta\geq\theta_2\)时,\(\beta(\theta)\leq\beta(\theta_2)=\alpha\)。
对所有\(\theta\in\Theta_0\),都有\(\beta(\theta)\leq\alpha\),满足水平为\(\alpha\)的要求。
3.2 一致最优性:备择假设空间上功效一致最高
对任意水平为\(\alpha\)的检验\(\tilde{\phi}\),必然满足\(E_{\theta_1}[\tilde{\phi}]\leq\alpha\)、\(E_{\theta_2}[\tilde{\phi}]\leq\alpha\)。根据引理6.4.1,对所有\(\theta_1<\theta<\theta_2\),都有\(E_\theta[\phi_1(X)]\geq E_\theta[\tilde{\phi}(X)]\)。
综上,\(\phi_1(x)\)是双边检验(i)的全局UMPT,这是三类双边检验中唯一存在全局UMPT的情形。
四、核心知识点总结表格
| 检验问题 | 原假设\(H_0\) | 备择假设\(H_1\) | 最优检验类型 | 检验函数形式(基于充分统计量\(T(x)\)) | 约束条件 | 核心性质 |
|---|---|---|---|---|---|---|
| 检验(i)' | \(\theta=\theta_1\) 或 \(\theta=\theta_2\) | \(\theta=\theta_3\)(\(\theta_1<\theta_3<\theta_2\)) | MPT | $$\phi(x)=\begin{cases}1, & k_1<T(x)<k_2 \ \gamma_i, & T(x)=k_i \ 0, & \text{其他}\end{cases}$$ | \(E_{\theta_1}[\phi]=\alpha\) \(E_{\theta_2}[\phi]=\alpha\) |
检验形式与\(\theta_3\)无关,由推广的N-P引理保证最优性 |
| 检验(i) | \(\theta\leq\theta_1\) 或 \(\theta\geq\theta_2\) | \(\theta_1<\theta<\theta_2\) | 全局UMPT | 同上 | 同上 | 功效函数为单峰凹函数,原假设空间上\(\beta(\theta)\leq\alpha\),备择空间上功效一致最优 |
| 检验(ii) | \(\theta_1\leq\theta\leq\theta_2\) | \(\theta<\theta_1\) 或 \(\theta>\theta_2\) | UMPUT(无全局UMPT) | $$\phi(x)=\begin{cases}1, & T(x)<k_1 \text{ 或 } T(x)>k_2 \ \gamma_i, & T(x)=k_i \ 0, & \text{其他}\end{cases}$$ | \(E_{\theta_1}[\phi]=\alpha\) \(E_{\theta_2}[\phi]=\alpha\) |
功效函数为凸函数,仅在无偏检验类中一致最优 |
| 检验(iii) | \(\theta=\theta_0\) | \(\theta\neq\theta_0\) | UMPUT(无全局UMPT) | 同上 | \(E_{\theta_0}[\phi]=\alpha\) \(\beta'(\theta_0)=0\) |
功效函数为凸函数,\(\theta_0\)为极小值点,仅在无偏检验类中一致最优 |
五、核心结论
- 推广的N-P引理是解决多约束假设检验问题的核心工具,是经典N-P引理在多约束场景下的直接推广;
- 单参数指数族的三类双边检验中,仅检验(i)存在全局UMPT,检验(ii)和(iii)不存在全局UMPT,仅能在无偏检验类中找到UMPUT;
- 所有最优检验均基于参数的充分统计量\(T(x)\)构造,临界值由无偏性的边界约束条件唯一确定,这是指数族分布充分性原则的直接体现。
引理6.4.2 完整讲解、严格证明与核心应用
承接上一讲的内容,我们已经通过推广的N-P引理得到了检验(i)''(\(H_0:\theta=\theta_1\)或\(\theta=\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\))的UMPT\(\phi_1(x)\),但要完成检验(i)全局UMPT的完整证明,还需验证\(\phi_1(x)\)在原假设全空间\(\theta\leq\theta_1\)或\(\theta\geq\theta_2\)上满足水平约束\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\);同时,后续求解检验(ii)的一致最优无偏检验(UMPUT),也需要一个针对「双边拒绝域检验」的最优性引理。本讲将完整讲解引理6.4.2的内容、严格证明、与引理6.4.1的本质差异,以及其两大核心应用。
一、引理6.4.2的正式表述与背景
1.1 适用分布与检验问题
针对单参数指数族分布:
其中\(Q(\theta)\)为\(\theta\)的严格增函数,\(T(x)\)为\(\theta\)的充分统计量。
考虑简单假设检验问题:
1.2 检验函数形式
若检验函数\(\phi_2(x)\)具有双边拒绝域的形式:
其中\(k_1<k_2\)为临界值,\(\gamma_{21},\gamma_{22}\)为随机化参数。
1.3 约束条件与核心结论
若存在\(k_i,\gamma_{2i}\)使得\(\phi_2(x)\)满足等式约束:
即\(\phi_2(x)\in\Phi'_\alpha\),则对所有满足相同等式约束的检验\(\tilde{\phi}(x)\in\Phi'_\alpha\),有:
且\(\phi_2(x)\)在\(R^+\cup R^-\)上几乎处处唯一。
二、引理6.4.2的严格证明
我们仅证明\(H_1:\theta=\theta_4 \ (\theta_4<\theta_1)\)的情形,\(H_1:\theta=\theta_5 \ (\theta_5>\theta_2)\)的证明完全对称。
步骤1:基于推广的N-P引理构造拒绝域
对应推广的N-P引理,令:
- 原假设两点的密度:\(f_1(x)=f(x,\theta_1), \ f_2(x)=f(x,\theta_2)\)
- 备择假设的密度:\(f_3(x)=f(x,\theta_4)\)
根据推广的N-P引理,最大化\(\mathbb{E}_{\theta_4}[\phi(X)]\)的检验,其拒绝域为:
将指数族密度代入,两边除以恒正的\(h(x)\),得:
由\(\theta_4<\theta_1<\theta_2\)且\(Q(\theta)\)严格递增,得\(Q(\theta_4)<Q(\theta_1)<Q(\theta_2)\),这是后续分析的核心前提。
步骤2:排除不符合约束的参数情形
我们的目标是找到\(c_1,c_2\),使得检验满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),因此需要逐一排除不可能的\(c_1,c_2\)符号组合。
情形1:\(c_1\leq0\)且\(c_2\leq0\)
此时不等式右边\(c_1f_1 + c_2f_2 \leq 0\),而左边\(f(x,\theta_4)>0\),因此\(R^+=\mathcal{X}\)(全样本空间),即\(\phi_2(x)\equiv1\)。
此时\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=1\),与\(0<\alpha<1\)的前提矛盾,排除。
情形2:\(c_1\leq0\)且\(c_2>0\)
将拒绝域不等式两边除以\(c_2a(\theta_2)e^{Q(\theta_2)T(x)}\)(恒正,不改变不等号方向),整理得:
其中:
对\(g(t)\)求一阶导数:
即\(g(t)\)是关于\(t\)的严格减函数,因此\(g(t)>1\)的解为\(T(x)<k\)(单边左拒绝域)。
根据单调似然比分布族的性质,单边左拒绝域对应的检验,其功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)是\(\theta\)的严格减函数,因此必有\(\beta(\theta_1) > \beta(\theta_2)\),无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\)的约束,排除。
情形3:唯一可行情形\(c_1>0\),进一步分析\(c_2\)的符号
由前两种情形的排除,必然有\(c_1>0\)。将拒绝域不等式两边除以\(c_1a(\theta_1)e^{Q(\theta_1)T(x)}\)(恒正),整理得:
其中:
我们继续分析\(d_2\)的符号(即\(c_2\)的符号):
-
若\(d_2\leq0\)(即\(c_2\geq0\)),对\(g(t)\)求一阶导数:
\[g'(t) = -b_1d_1e^{-b_1t} + b_2d_2e^{b_2t} < 0 \]\(g(t)\)仍为严格减函数,拒绝域为单边左拒绝域,与情形2一致,无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\),排除。
-
因此必然有\(d_2>0\)(即\(c_2<0\)),此时对\(g(t)\)求二阶导数:
\[g''(t) = b_1^2d_1e^{-b_1t} + b_2^2d_2e^{b_2t} > 0 \]即\(g(t)\)是关于\(t\)的严格凸函数(开口向上的U型曲线)。
步骤3:确定拒绝域的最终形式
严格凸函数\(g(t)=1\)最多有两个解\(k_1<k_2\),且:
- 当\(t<k_1\)或\(t>k_2\)时,\(g(t)>1\),对应拒绝域;
- 当\(k_1<t<k_2\)时,\(g(t)<1\),对应接受域。
因此拒绝域为:
与引理中\(\phi_2(x)\)的形式完全一致。
步骤4:最优性与唯一性证明
由上述推导,\(\phi_2(x)\)满足推广的N-P引理的检验形式,且约束为等式\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),符合推广的N-P引理的结论(1)。
因此对所有满足相同等式约束的\(\tilde{\phi}(x)\in\Phi'_\alpha\),必有\(\mathbb{E}_{\theta_4}[\phi_2(X)] \geq \mathbb{E}_{\theta_4}[\tilde{\phi}(X)]\)。
唯一性证明与经典N-P引理一致:若\(\tilde{\phi}\)也达到最大功效,则必须在\(R^+\cup R^-\)上满足\(\tilde{\phi}(x)=\phi_2(x)\)几乎处处成立,因此\(\phi_2(x)\)在\(R^+\cup R^-\)上唯一。
三、引理6.4.2与引理6.4.1的核心差异
这两个引理是指数族双边检验的两大核心工具,但存在本质区别,我们通过表格清晰对比:
| 对比维度 | 引理6.4.1 | 引理6.4.2 |
|---|---|---|
| 检验问题 | \(H_0:\theta=\theta_1/\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\)(中间备择) | \(H_0:\theta=\theta_1/\theta_2 \leftrightarrow H_1:\theta<\theta_1\)或\(\theta>\theta_2\)(两侧备择) |
| 检验形式 | 中间拒绝域(\(k_1<T<k_2\)时拒绝) | 双边拒绝域(\(T<k_1\)或\(T>k_2\)时拒绝) |
| 拉格朗日常数符号 | \(c_1\geq0, c_2\geq0\) | \(c_1>0, c_2<0\) |
| 适用的检验类 | 不等式约束检验类\(\Phi_\alpha\)(\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)) | 仅等式约束检验类\(\Phi'_\alpha\)(\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)) |
| 最优性性质 | 全局最优势检验(MPT) | 仅等式约束下的最优检验,非全局MPT |
| 核心应用 | 证明检验(i)的全局UMPT | 证明检验(ii)的UMPUT,补全检验(i)的水平有效性 |
关键差异的本质原因
推广的N-P引理的结论(2)(对不等式约束的检验类最优),要求\(c_1,c_2\)均非负;而引理6.4.2中\(c_2<0\),不满足该条件,因此仅能对等式约束的检验类成立。
但这一限制恰好适配无偏检验的要求:根据无偏检验的边界性质,任何水平为\(\alpha\)的无偏检验,都必须满足\(\mathbb{E}_{\theta_1}[\phi(X)]=\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),因此引理6.4.2是求解UMPUT的核心工具。
四、引理6.4.2的两大核心应用
应用1:补全检验(i)全局UMPT的证明
检验(i)的完整形式为:
我们已经证明\(\phi_1(x)\)是检验(i)''的UMPT,现在需要证明\(\phi_1(x)\)是水平为\(\alpha\)的检验,即对所有\(\theta\leq\theta_1\)或\(\theta\geq\theta_2\),有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\)。
证明逻辑:
- 取任意\(\theta_4<\theta_1\),考虑检验\(\tilde{\phi}(x)\equiv\alpha\),显然满足\(\mathbb{E}_{\theta_1}[\tilde{\phi}]=\mathbb{E}_{\theta_2}[\tilde{\phi}]=\alpha\),属于等式约束检验类\(\Phi'_\alpha\)。
- 引理6.4.2的对称情形(中间拒绝域的最优性)告诉我们,\(\phi_1(x)\)在\(\theta_4<\theta_1\)时的功效\(\beta_{\phi_1}(\theta_4)\),是所有满足等式约束的检验中最小的,因此\(\beta_{\phi_1}(\theta_4) \leq \beta_{\tilde{\phi}}(\theta_4)=\alpha\)。
- 同理,对任意\(\theta_5>\theta_2\),有\(\beta_{\phi_1}(\theta_5) \leq \alpha\)。
因此\(\phi_1(x)\)在原假设全空间上满足\(\beta(\theta)\leq\alpha\),是水平为\(\alpha\)的检验。结合其在备择空间上的一致最优性,\(\phi_1(x)\)是检验(i)的全局UMPT,完成了完整证明。
应用2:为检验(ii)的UMPUT提供核心支撑
检验(ii)的完整形式为:
该问题不存在全局UMPT,我们需要在无偏检验类中寻找UMPUT。根据无偏检验的定义,所有无偏检验都必须满足边界条件\(\mathbb{E}_{\theta_1}[\phi(X)]=\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),恰好属于引理6.4.2的等式约束检验类\(\Phi'_\alpha\)。
引理6.4.2直接证明了:\(\phi_2(x)\)在所有无偏检验中,对任意\(\theta<\theta_1\)或\(\theta>\theta_2\),功效都达到最大,因此\(\phi_2(x)\)就是检验(ii)的一致最优无偏检验(UMPUT)。
五、核心结论总结
- 引理6.4.2是推广的N-P引理在「双边拒绝域检验」中的具体应用,解决了两侧备择假设下,等式约束检验类的最优性问题;
- 该引理的核心限制是仅对等式约束的检验类成立,本质是拉格朗日常数\(c_2<0\),不满足非负条件,因此无法得到全局MPT,但完美适配无偏检验的边界约束;
- 该引理是连接「简单假设检验」与「复合假设双边检验」的关键桥梁,既补全了检验(i)全局UMPT的证明,也为检验(ii)和(iii)的UMPUT提供了核心理论支撑。
推论1与推论2 详细讲解、证明拆解与核心意义
承接之前的引理6.4.1与6.4.2,我们将完整拆解这两个推论的证明逻辑、核心结论与统计意义,完整衔接复合假设双边检验的理论链条。
前置知识回顾
为保证逻辑连贯,先明确核心前置概念:
- 单参数指数族:\(f(x,\theta)=a(\theta)h(x)e^{Q(\theta)T(x)}\),其中\(Q(\theta)\)为\(\theta\)的严格增函数,\(T(x)\)是\(\theta\)的充分统计量,功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)关于\(\theta\)连续。
- 检验问题(ii)'':\(H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
- UMPUT(一致最优无偏检验):需满足两个核心条件
- 无偏性:原假设上\(\mathbb{E}_\theta[\phi(X)]\leq\alpha\),备择假设上\(\mathbb{E}_\theta[\phi(X)]\geq\alpha\);
- 一致最优性:在所有水平为\(\alpha\)的无偏检验中,对任意备择\(\theta\),功效\(\mathbb{E}_\theta[\phi(X)]\)达到最大。
- 引理6.4.2核心结论:双边拒绝域检验\(\phi_2(x)\)(\(T<k_1\)或\(T>k_2\)时拒绝),在等式约束检验类\(\Phi'_\alpha=\{\phi:\mathbb{E}_{\theta_1}[\phi]=\mathbb{E}_{\theta_2}[\phi]=\alpha\}\)中,对任意单点备择\(\theta<\theta_1\)或\(\theta>\theta_2\)是最优的,且检验形式与备择\(\theta\)无关。
一、推论1 详细讲解与完整证明
1. 推论1正式表述
\(\phi_2(x)\)是以下假设检验问题的一致最优无偏检验(UMPUT):
其中\(\phi_2(x)\)为双边拒绝域检验:
且满足约束\(\mathbb{E}_{\theta_1}[\phi_2(X)]=\mathbb{E}_{\theta_2}[\phi_2(X)]=\alpha\)。
2. 证明分步拆解
证明分为三大核心步骤,完整覆盖「一致最优性→无偏性→无偏检验类范围」的完整逻辑链。
步骤1:证明\(\phi_2(x)\)在整个备择空间的一致最优性
引理6.4.2仅证明了\(\phi_2(x)\)对单点备择\(\theta=\theta_4<\theta_1\)或\(\theta=\theta_5>\theta_2\)的最优性,而推论1需要推广到整个备择空间。
关键性质:\(\phi_2(x)\)的临界值\(k_1,k_2\)、随机化参数\(\gamma_{2i}\),仅由\(\theta_1,\theta_2\)和显著性水平\(\alpha\)决定,与备择假设的具体取值\(\theta_4,\theta_5\)完全无关。
因此引理6.4.2的最优性结论,对所有\(\theta<\theta_1\)或\(\theta>\theta_2\)都成立,即对任意\(\tilde{\phi}\in\Phi'_\alpha\),有:
这就证明了\(\phi_2(x)\)在\(\Phi'_\alpha\)类中,对整个备择空间是一致最优的。
步骤2:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验
无偏检验的两个要求,我们逐一验证:
- 原假设约束:\(\phi_2(x)\)满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),自然满足原假设上\(\mathbb{E}_\theta[\phi_2]\leq\alpha\)的水平要求。
- 备择假设约束:取基准检验\(\phi^*(x)\equiv\alpha\)(恒等于\(\alpha\)的随机化检验),显然\(\mathbb{E}_{\theta_1}[\phi^*]=\mathbb{E}_{\theta_2}[\phi^*]=\alpha\),即\(\phi^*\in\Phi'_\alpha\)。
根据步骤1的最优性结论,对任意备择\(\theta\),有:
完美满足无偏检验在备择假设上的要求。
综上,\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验。
步骤3:证明所有无偏检验都属于\(\Phi'_\alpha\),完成UMPUT证明
设\(\tilde{\phi}(x)\)是检验(ii)''的任意一个水平为\(\alpha\)的无偏检验,我们证明它必然属于\(\Phi'_\alpha\)。
根据无偏性定义:
- 原假设上:\(\mathbb{E}_{\theta_1}[\tilde{\phi}]\leq\alpha\),\(\mathbb{E}_{\theta_2}[\tilde{\phi}]\leq\alpha\);
- 备择假设上:\(\mathbb{E}_\theta[\tilde{\phi}]\geq\alpha\),对所有\(\theta<\theta_1\)或\(\theta>\theta_2\)。
指数族的功效函数\(\beta(\theta)=\mathbb{E}_\theta[\tilde{\phi}(X)]\)是关于\(\theta\)的连续函数,取\(\theta\to\theta_1^-\)(从左侧趋近\(\theta_1\)),由连续性得:
无偏性要求\(\lim_{\theta\to\theta_1^-} \beta(\theta)\geq\alpha\),原假设要求\(\beta(\theta_1)\leq\alpha\),因此只能取等号:\(\mathbb{E}_{\theta_1}[\tilde{\phi}]=\alpha\)。
同理,取\(\theta\to\theta_2^+\),可得\(\mathbb{E}_{\theta_2}[\tilde{\phi}]=\alpha\)。
这就证明了:检验(ii)''的所有水平为\(\alpha\)的无偏检验,都属于等式约束检验类\(\Phi'_\alpha\)。
结合步骤1的结论:\(\phi_2(x)\)在\(\Phi'_\alpha\)中是一致最优的,因此\(\phi_2(x)\)在所有无偏检验中一致最优,即\(\phi_2(x)\)是检验(ii)''的水平为\(\alpha\)的UMPUT。
3. 推论1的核心意义
- 把引理6.4.2的「单点备择最优检验」推广到「复合备择的一致最优无偏检验」,解决了两点原假设检验(ii)''的UMPUT存在性与构造问题;
- 明确了无偏检验类的范围:所有无偏检验必须满足原假设两点的功效严格等于\(\alpha\),为后续复合原假设检验(ii)的UMPUT证明奠定了核心基础。
二、推论2 详细讲解与完整证明
1. 推论2正式表述
记\(\phi_2'(x) = 1 - \phi_1(x)\),其中\(\phi_1(x)\)是引理6.4.1中检验(i)''的UMPT(中间拒绝域检验):
且满足\(\mathbb{E}_{\theta_1}[\phi_1(X)]=\mathbb{E}_{\theta_2}[\phi_1(X)]=\alpha\)。
则\(\phi_2'(x)\)是检验(ii)''的水平为\(1-\alpha\)的UMPUT。
2. 证明分步拆解
证明核心是利用检验的对偶性,结合推论1与引理的唯一性结论完成。
步骤1:推导\(\phi_2'(x)\)的具体形式
由\(\phi_2'(x)=1-\phi_1(x)\),直接代入\(\phi_1(x)\)的形式,分情况计算:
- 当\(T(x)<k_1\)或\(T(x)>k_2\)时,\(\phi_1(x)=0\),因此\(\phi_2'(x)=1\);
- 当\(T(x)=k_i\)时,\(\phi_1(x)=\gamma_{1i}\),因此\(\phi_2'(x)=1-\gamma_{1i}\);
- 当\(k_1<T(x)<k_2\)时,\(\phi_1(x)=1\),因此\(\phi_2'(x)=0\)。
最终\(\phi_2'(x)\)的形式为:
完全符合引理6.4.2中双边拒绝域检验的标准形式,与推论1中UMPUT的形式一致。
步骤2:验证\(\phi_2'(x)\)的水平为\(1-\alpha\)
由期望的线性性质,对\(i=1,2\)有:
而\(\phi_1(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_1(X)]=\alpha\),因此:
即\(\phi_2'(x)\in\Phi'_{1-\alpha}\),满足水平为\(1-\alpha\)的等式约束。
步骤3:结合唯一性与推论1,证明是UMPUT
根据推论1,检验(ii)''的水平为\(1-\alpha\)的UMPUT,必须是满足\(\mathbb{E}_{\theta_1}[\phi]=\mathbb{E}_{\theta_2}[\phi]=1-\alpha\)的双边拒绝域检验;同时根据引理6.4.2,这种检验在\(R^+\cup R^-\)上是几乎处处唯一的。
而\(\phi_2'(x)\)恰好满足:
- 双边拒绝域的标准形式;
- 水平\(1-\alpha\)的等式约束;
- 唯一性保证它就是检验(ii)''的水平为\(1-\alpha\)的UMPUT。
3. 推论2的核心意义:检验的对偶性
这个推论揭示了假设检验中非常重要的对偶性质,大幅简化了双边检验的构造:
- 拒绝域与接受域的对偶:检验(i)''的UMPT\(\phi_1(x)\),拒绝域是中间区间\(k_1<T<k_2\);其补检验\(1-\phi_1(x)\)的拒绝域正好是两侧区间\(T<k_1\)或\(T>k_2\),完美对应检验(ii)''的拒绝域要求。
- 检验类型的对偶:中间拒绝域的UMPT,其补检验就是双边拒绝域的UMPUT,仅需调整显著性水平为\(1-\alpha\),无需重复推导临界值。
- 计算简化:实际应用中,我们只需要求出检验(i)的临界值,就可以直接得到检验(ii)的临界值,大幅降低计算量。
三、核心结论总结表格
| 对比维度 | 推论1 | 推论2 |
|---|---|---|
| 核心结论 | 双边拒绝域检验\(\phi_2(x)\)是检验(ii)''的水平为\(\alpha\)的UMPUT | 检验(i)''的UMPT\(\phi_1(x)\)的补检验\(1-\phi_1(x)\),是检验(ii)''的水平为\(1-\alpha\)的UMPUT |
| 检验形式 | 双边拒绝域:\(T<k_1\)或\(T>k_2\)时拒绝\(H_0\) | 双边拒绝域:\(T<k_1\)或\(T>k_2\)时拒绝\(H_0\),与\(\phi_1(x)\)的拒绝域完全相反 |
| 约束条件 | \(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\) | \(\mathbb{E}_{\theta_1}[\phi_2']=\mathbb{E}_{\theta_2}[\phi_2']=1-\alpha\) |
| 核心逻辑 | 1. 检验形式与备择\(\theta\)无关,推广到复合备择; 2. 所有无偏检验都属于等式约束类\(\Phi'_\alpha\); 3. 引理6.4.2保证一致最优性 |
1. 补检验符合双边拒绝域的标准形式; 2. 期望线性性保证水平匹配; 3. 唯一性保证其为UMPUT |
| 理论价值 | 完成两点原假设双边检验的UMPUT构造,为复合原假设检验(ii)奠基 | 揭示中间拒绝域与双边拒绝域检验的对偶性,打通两类双边检验的理论关联 |
| 应用价值 | 给出双边检验UMPUT的标准构造方法 | 简化双边检验的计算,无需重复求解临界值 |
定理6.4.2与6.4.3 完整讲解、证明拆解与核心差异
承接之前的引理与推论,这两个定理是单参数指数族双边检验的核心最终结论,分别解决了两类复合原假设双边检验的最优检验构造问题,明确了全局UMPT与UMPUT的适用场景。
前置知识回顾
- 单参数指数族标准形式:\(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\),其中\(Q(\theta)\)为\(\theta\)的严格增函数,\(T(x)\)是\(\theta\)的充分统计量,功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)关于\(\theta\)连续。
- 两类核心复合双边检验:
- 检验(i)(带内检验):\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\)
- 检验(ii)(带外检验):\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
- 关键检验形式:
- 中间拒绝域检验\(\phi_1(x)\):\(k_1<T(x)<k_2\)时拒绝\(H_0\),满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\)
- 双边拒绝域检验\(\phi_2(x)\):\(T(x)<k_1\)或\(T(x)>k_2\)时拒绝\(H_0\),满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\)
- 核心引理结论:
- 引理6.4.1:\(\phi_1(x)\)是两点原假设检验(i)''的UMPT,对所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)的检验,备择上功效最优(基于推广N-P引理结论(2),\(c_1,c_2\geq0\))
- 引理6.4.2:\(\phi_2(x)\)是两点原假设检验(ii)''的UMPUT,仅对满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)的检验,备择上功效最优(基于推广N-P引理结论(1),\(c_1,c_2\)可负)
一、定理6.4.2 详细讲解与证明拆解
1. 定理正式表述
对于假设检验问题
若存在\(k_i,\gamma_{1i}(i=1,2)\),使得中间拒绝域检验\(\phi_1(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_1(X)]=\alpha(i=1,2)\),则\(\phi_1(x)\)是检验(i)的一致最优检验(UMPT)。
2. 证明分步拆解
证明分为两大核心步骤:第一步证明\(\phi_1(x)\)是水平为\(\alpha\)的检验(原假设上满足第一类错误概率约束);第二步证明\(\phi_1(x)\)在备择假设上是一致最优的。
步骤1:证明\(\phi_1(x)\)是水平为\(\alpha\)的检验
水平为\(\alpha\)的检验要求:对所有\(\theta\in\Theta_0\)(即\(\theta\leq\theta_1\)或\(\theta\geq\theta_2\)),有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\)。
我们利用检验的对偶性和推论2的结论完成证明:
- 由推论2,\(\phi_2'(x)=1-\phi_1(x)\)是检验(ii)''的水平为\(1-\alpha\)的UMPUT,即对所有\(\theta<\theta_1\)或\(\theta>\theta_2\),\(\phi_2'(x)\)在所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=1-\alpha\)的检验中功效最优。
- 取基准检验\(\tilde{\phi}(x)\equiv1-\alpha\),显然满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=1-\alpha\),因此由最优性有:\[\mathbb{E}_\theta[\phi_2'(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] = 1-\alpha, \quad \forall \theta<\theta_1 \text{ 或 } \theta>\theta_2 \]
- 代入\(\phi_2'(x)=1-\phi_1(x)\),由期望的线性性质得:\[\mathbb{E}_\theta[1-\phi_1(X)] \geq 1-\alpha \]移项化简后直接得到:\[\mathbb{E}_\theta[\phi_1(X)] \leq \alpha, \quad \forall \theta<\theta_1 \text{ 或 } \theta>\theta_2 \]
- 同时,\(\phi_1(x)\)在边界点满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\),因此对所有\(\theta\in\Theta_0\),都有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\),即\(\phi_1(x)\)是水平为\(\alpha\)的检验。
步骤2:证明\(\phi_1(x)\)是一致最优的
一致最优性要求:对任意水平为\(\alpha\)的检验\(\tilde{\phi}(x)\),以及所有\(\theta\in\Theta_1\)(\(\theta_1<\theta<\theta_2\)),有\(\mathbb{E}_\theta[\phi_1(X)]\geq\mathbb{E}_\theta[\tilde{\phi}(X)]\)。
证明逻辑:
- 设\(\tilde{\phi}(x)\)是检验(i)的任意一个水平为\(\alpha\)的检验,即对所有\(\theta\leq\theta_1\)或\(\theta\geq\theta_2\),有\(\mathbb{E}_\theta[\tilde{\phi}(X)]\leq\alpha\)。
- 特别地,在边界点\(\theta=\theta_1\)和\(\theta=\theta_2\)处,必然满足\(\mathbb{E}_{\theta_1}[\tilde{\phi}]\leq\alpha\)、\(\mathbb{E}_{\theta_2}[\tilde{\phi}]\leq\alpha\),即\(\tilde{\phi}(x)\)属于引理6.4.1中的不等式约束检验类\(\Phi_\alpha\)。
- 根据引理6.4.1的推论,\(\phi_1(x)\)是检验(i)''的UMPT,对所有\(\tilde{\phi}\in\Phi_\alpha\),以及任意\(\theta_1<\theta<\theta_2\),都有:\[\mathbb{E}_\theta[\phi_1(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] \]
- 这就证明了\(\phi_1(x)\)在所有水平为\(\alpha\)的检验中,对备择假设全空间的功效一致最高。
综上,\(\phi_1(x)\)是检验(i)的水平为\(\alpha\)的UMPT。
二、定理6.4.3 详细讲解与证明拆解
1. 定理正式表述
对于假设检验问题
若存在\(k_i,\gamma_{2i}(i=1,2)\),使得双边拒绝域检验\(\phi_2(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_2(X)]=\alpha(i=1,2)\),则\(\phi_2(x)\)是检验(ii)的一致最优无偏检验(UMPUT)。
2. 证明分步拆解
证明分为两大核心步骤:第一步证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验;第二步证明\(\phi_2(x)\)在所有无偏检验中是一致最优的。
步骤1:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验
无偏检验需要满足两个条件:
- 水平约束:对所有\(\theta\in\Theta_0\)(\(\theta_1\leq\theta\leq\theta_2\)),\(\mathbb{E}_\theta[\phi_2(X)]\leq\alpha\);
- 无偏性:对所有\(\theta\in\Theta_1\)(\(\theta<\theta_1\)或\(\theta>\theta_2\)),\(\mathbb{E}_\theta[\phi_2(X)]\geq\alpha\)。
我们同样利用对偶性和引理6.4.1的结论完成证明:
- 构造补检验\(\phi_1'(x)=1-\phi_2(x)\),代入\(\phi_2(x)\)的形式,可得\(\phi_1'(x)\)是中间拒绝域检验:\[\phi_1'(x) = \begin{cases} 1, & k_1<T(x)<k_2 \\ 1-\gamma_{2i}, & T(x)=k_i \\ 0, & T(x)<k_1 \text{ 或 } T(x)>k_2 \end{cases} \]
- 由\(\mathbb{E}_{\theta_i}[\phi_2]=\alpha\),得\(\mathbb{E}_{\theta_i}[\phi_1']=1-\alpha(i=1,2)\),符合引理6.4.1的检验形式,因此\(\phi_1'(x)\)是检验(i)''的水平为\(1-\alpha\)的UMPT。
- 取基准检验\(\tilde{\phi}(x)\equiv1-\alpha\),由最优性得:对所有\(\theta_1<\theta<\theta_2\),有\[\mathbb{E}_\theta[\phi_1'(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] = 1-\alpha \]
- 代入\(\phi_1'(x)=1-\phi_2(x)\),化简得:\[1-\mathbb{E}_\theta[\phi_2(X)] \geq 1-\alpha \implies \mathbb{E}_\theta[\phi_2(X)] \leq \alpha, \quad \forall \theta_1<\theta<\theta_2 \]结合边界点\(\mathbb{E}_{\theta_i}[\phi_2]=\alpha\),对所有\(\theta\in\Theta_0\),都有\(\mathbb{E}_\theta[\phi_2(X)]\leq\alpha\),满足水平约束。
- 无偏性验证:根据引理6.4.2的推论1,已经证明对所有\(\theta<\theta_1\)或\(\theta>\theta_2\),有\(\mathbb{E}_\theta[\phi_2(X)]\geq\alpha\),满足无偏性要求。
综上,\(\phi_2(x)\)是检验(ii)的水平为\(\alpha\)的无偏检验。
步骤2:证明\(\phi_2(x)\)是一致最优无偏检验
一致最优无偏性要求:对任意水平为\(\alpha\)的无偏检验\(\tilde{\phi}(x)\),以及所有\(\theta\in\Theta_1\),有\(\mathbb{E}_\theta[\phi_2(X)]\geq\mathbb{E}_\theta[\tilde{\phi}(X)]\)。
证明逻辑:
- 设\(\tilde{\phi}(x)\)是检验(ii)的任意一个水平为\(\alpha\)的无偏检验,根据无偏检验的边界性质,指数族的功效函数连续,因此必然满足:\[\mathbb{E}_{\theta_1}[\tilde{\phi}(X)] = \alpha, \quad \mathbb{E}_{\theta_2}[\tilde{\phi}(X)] = \alpha \]即\(\tilde{\phi}(x)\)属于等式约束检验类\(\Phi'_\alpha\)。
- 根据引理6.4.2的推论1,\(\phi_2(x)\)是检验(ii)''的UMPUT,对所有\(\tilde{\phi}\in\Phi'_\alpha\),以及任意\(\theta<\theta_1\)或\(\theta>\theta_2\),都有:\[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] \]
- 这就证明了\(\phi_2(x)\)在所有水平为\(\alpha\)的无偏检验中,对备择假设全空间的功效一致最高。
综上,\(\phi_2(x)\)是检验(ii)的水平为\(\alpha\)的UMPUT。
三、两个定理的核心差异与本质原因
1. 核心差异对比表
| 对比维度 | 定理6.4.2(检验(i)) | 定理6.4.3(检验(ii)) |
|---|---|---|
| 检验问题 | \(H_0:\theta\leq\theta_1/\theta\geq\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\) | \(H_0:\theta_1\leq\theta\leq\theta_2 \leftrightarrow H_1:\theta<\theta_1/\theta>\theta_2\) |
| 检验形式 | 中间拒绝域:\(k_1<T<k_2\)时拒绝\(H_0\) | 双边拒绝域:\(T<k_1\)或\(T>k_2\)时拒绝\(H_0\) |
| 最优检验类型 | 全局一致最优检验(UMPT) | 一致最优无偏检验(UMPUT) |
| 适用检验类 | 所有水平为\(\alpha\)的检验(不等式约束\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)) | 仅水平为\(\alpha\)的无偏检验(等式约束\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)) |
| 理论依据 | 推广N-P引理结论(2)(要求\(c_1\geq0,c_2\geq0\)) | 推广N-P引理结论(1)(不要求\(c_1,c_2\)非负) |
| 最优性范围 | 全检验类中一致最优 | 仅无偏检验类中一致最优,无全局UMPT |
2. 本质原因
两个定理的最优性差异,根源是推广的Neyman-Pearson引理两个结论的适用条件不同:
- 定理6.4.2对应的\(\phi_1(x)\),其构造用到的拉格朗日常数\(c_1,c_2\)均非负,满足推广N-P引理结论(2)的条件,因此最优性可以覆盖所有满足不等式约束的水平为\(\alpha\)的检验,得到全局UMPT。
- 定理6.4.3对应的\(\phi_2(x)\),其构造用到的拉格朗日常数\(c_2<0\),不满足结论(2)的非负要求,只能用推广N-P引理的结论(1),最优性仅能覆盖满足等式约束的检验类。而无偏检验恰好都满足等式约束,因此只能得到无偏检验类中的最优检验(UMPUT),不存在全局UMPT。
3. 关键注释解读
定理6.4.2是双边检验章节唯一的全局UMPT,其余所有双边检验(包括检验(ii)、点原假设的双侧检验(iii))都不存在全局UMPT,仅能找到UMPUT。这是双边检验与单边检验最核心的区别之一。
四、最终结论总结
- 单参数指数族的两类复合双边检验,都可以通过充分统计量\(T(x)\)构造最优检验,临界值由原假设边界点的功效约束\(\mathbb{E}_{\theta_i}[\phi]=\alpha\)唯一确定。
- 带内检验(检验(i))存在全局UMPT,为中间拒绝域检验,在所有水平为\(\alpha\)的检验中功效一致最优。
- 带外检验(检验(ii))不存在全局UMPT,仅存在UMPUT,为双边拒绝域检验,在所有无偏检验中功效一致最优。
- 两类检验的构造具有对偶性:检验(i)的UMPT的补检验,就是检验(ii)的水平为\(1-\alpha\)的UMPUT,大幅简化了实际应用中的计算与构造。
点原假设双侧检验(iii)与引理6.4.3 完整讲解、推导证明与核心意义
一、检验问题(iii)的背景与核心难点
我们研究的是数理统计中最常用的点原假设双侧检验:
1.1 检验的定位
该检验是区间原假设双边检验(ii)的特例(令\(\theta_1=\theta_2=\theta_0\)),因此其最优检验的形式与检验(ii)一致,为双边拒绝域检验:
其中\(T(x)\)是单参数指数族中\(\theta\)的充分统计量。
1.2 核心难点:定解条件不足
- 对于区间原假设检验(ii),我们通过两个边界条件\(\mathbb{E}_{\theta_1}[\phi(X)]=\alpha\)、\(\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),可以唯一确定两个临界值\(k_1,k_2\);
- 对于点原假设检验(iii),原假设仅含单点\(\theta_0\),天然只有一个定解条件\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),无法唯一确定两个临界值,必须补充第二个约束条件。
1.3 补充条件的来源:无偏检验的性质
检验(iii)不存在全局UMPT,我们需要在无偏检验类中寻找UMPUT。无偏检验的核心性质是:
功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)在\(\theta_0\)处取得极小值(原假设处功效为\(\alpha\),备择假设处功效≥α),而指数族的功效函数连续可导,因此极小值点满足\(\beta'(\theta_0)=0\),这就是我们需要的第二个定解条件。
引理6.4.3的核心目标,就是推导指数族下功效函数的导数表达式,并给出\(\beta'(\theta_0)=0\)的等价可计算条件。
二、引理6.4.3 完整表述与分步证明
引理6.4.3 正式表述
对于单参数指数族分布\(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\),有以下三个核心结论:
- 充分统计量\(T(X)\)的期望可表示为:\[\mathbb{E}_\theta[T(X)] = -\frac{a'(\theta)}{a(\theta)Q'(\theta)} \tag{6.4.18} \]
- 检验函数\(\phi(x)\)的功效函数\(\beta(\theta)\)的导数为:\[\beta'(\theta) = Q'(\theta)\left\{ \mathbb{E}_\theta[\phi(X)T(X)] - \mathbb{E}_\theta[T(X)]\mathbb{E}_\theta[\phi(X)] \right\} \tag{6.4.19} \]
- 检验(iii)的任一水平为\(\alpha\)的无偏检验,满足\(\beta'(\theta_0)=0\),其等价条件为:\[\mathbb{E}_{\theta_0}[\phi(X)T(X)] = \mathbb{E}_{\theta_0}[\phi(X)]\mathbb{E}_{\theta_0}[T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \tag{6.4.20} \]
分步证明
步骤1:证明充分统计量的期望公式(6.4.18)
指数族的概率密度满足归一性:对任意\(\theta\),密度在全样本空间的积分等于1,即
指数族满足正则条件,积分与求导可交换顺序,因此对(*)式两边关于\(\theta\)求导:
根据乘积求导法则展开左边的导数:
将积分拆分为两项,并提取公因子:
结合密度的定义\(f(x,\theta)=a(\theta)h(x)e^{Q(\theta)T(x)}\),对两项分别变形:
- 第一项:\(\int_{\mathcal{X}} h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} f(x,\theta) d\mu(x) = \frac{1}{a(\theta)}\)(归一性)
- 第二项:\(\int_{\mathcal{X}} T(x) h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} T(x)f(x,\theta) d\mu(x) = \frac{\mathbb{E}_\theta[T(X)]}{a(\theta)}\)(期望定义)
将两项代入求导后的等式:
化简后得到:
移项整理,最终得到(6.4.18)式:
步骤2:证明功效函数的导数公式(6.4.19)
功效函数的定义为:
同样利用正则条件,交换积分与求导顺序,对\(\theta\)求导:
展开导数(与步骤1完全一致),拆分为两项:
对两项分别变形,结合密度定义:
- 第一项:\(\int_{\mathcal{X}} \phi(x)h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} \phi(x)f(x,\theta) d\mu(x) = \frac{\beta(\theta)}{a(\theta)}\)
- 第二项:\(\int_{\mathcal{X}} \phi(x)T(x)h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \mathbb{E}_\theta[\phi(X)T(X)]\)
代入导数表达式:
化简后:
此时将步骤1得到的\(\frac{a'(\theta)}{a(\theta)} = -Q'(\theta)\mathbb{E}_\theta[T(X)]\)代入上式,替换掉\(\frac{a'(\theta)}{a(\theta)}\):
提取公因子\(Q'(\theta)\),最终得到(6.4.19)式:
补充理解:该式的统计意义是\(\beta'(\theta) = Q'(\theta) \cdot \text{Cov}_\theta\left( \phi(X), T(X) \right)\),即功效函数的导数与检验函数和充分统计量的协方差成正比,直观反映了参数变化时检验功效的变化速率。
步骤3:证明无偏检验的等价条件(6.4.20)
对于检验(iii)的水平为\(\alpha\)的无偏检验,满足两个核心性质:
- 水平条件:原假设为单点\(\theta_0\),因此\(\mathbb{E}_{\theta_0}[\phi(X)] = \beta(\theta_0) = \alpha\);
- 无偏性:对所有\(\theta\neq\theta_0\),\(\beta(\theta) \geq \alpha\),即\(\theta_0\)是功效函数\(\beta(\theta)\)的极小值点。
由于指数族的功效函数连续可导,极小值点处的一阶导数必为0,即\(\beta'(\theta_0) = 0\)。
将\(\beta'(\theta_0)=0\)代入(6.4.19)式:
由于\(Q(\theta)\)是\(\theta\)的严格增函数,因此\(Q'(\theta_0) \neq 0\),要使等式成立,必须满足大括号内的项为0:
结合水平条件\(\mathbb{E}_{\theta_0}[\phi(X)] = \alpha\),代入后直接得到(6.4.20)式:
三、引理6.4.3的核心意义与应用价值
-
解决了定解条件不足的核心问题
该引理为点原假设双侧检验补充了第二个定解条件,结合\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),两个方程可以唯一确定双边检验的两个临界值\(k_1,k_2\)(以及随机化参数),为构造检验(iii)的UMPUT提供了可计算的约束。 -
揭示了无偏检验的本质特征
点原假设双侧检验的无偏检验,不仅要满足原假设处的第一类错误概率为\(\alpha\),还要满足检验函数与充分统计量在原假设下不相关(协方差为0),这是功效函数在原假设处取得极小值的等价条件。 -
衔接了区间原假设与点原假设双边检验
区间原假设检验(ii)用两个边界点的功效约束定解,点原假设检验(iii)用原假设点的功效约束+导数约束定解,本质是检验(ii)在\(\theta_1\to\theta_2=\theta_0\)时的极限情况,该引理完成了两类双边检验的理论衔接。 -
为实际应用提供了直接的计算依据
实际应用中,正态分布的双侧z检验、t检验,二项分布的双侧检验等常用的点原假设双侧检验,其临界值的确定本质上都基于这两个约束条件,该引理为这些经典检验的最优性提供了理论支撑。
定理6.4.4 点原假设双侧检验的UMPUT 完整讲解与严格证明
一、问题回顾与核心思路
1.1 检验问题与核心难点
我们研究的是数理统计中最常用的点原假设双侧检验:
该检验是区间原假设双边检验(ii)的特例(\(\theta_1=\theta_2=\theta_0\)),核心难点在于定解条件不足:
- 区间原假设检验(ii)可通过两个边界条件\(\mathbb{E}_{\theta_1}[\phi]=\alpha\)、\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)确定两个临界值;
- 点原假设仅能提供一个天然约束\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),无法唯一确定双边检验的两个临界值\(k_1,k_2\)。
1.2 解决思路:转化为推广N-P引理的双约束问题
根据引理6.4.3,检验(iii)的任一无偏检验必须满足两个条件:
- 水平约束:\(\mathbb{E}_{\theta_0}[\phi(X)] = \alpha\)(原假设处第一类错误概率为\(\alpha\));
- 无偏性等价约束:\(\mathbb{E}_{\theta_0}[\phi(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)(功效函数在\(\theta_0\)处导数为0,即\(\beta'(\theta_0)=0\))。
这两个等式约束恰好匹配推广的Neyman-Pearson引理的双等式约束条件,因此我们可以通过推广的N-P引理,在满足这两个约束的检验类中,找到备择假设全空间上功效一致最优的检验,即UMPUT。
二、定理6.4.4 正式表述
定义约束检验类
记满足检验(iii)无偏性双约束的检验类为:
定理核心结论
- 一致最优性:若存在\(k_i,\gamma_{2i}(i=1,2)\),使得双边拒绝域检验\[\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ \gamma_{2i}, & T(x)=k_i \ (i=1,2) \\ 0, & k_1 < T(x) < k_2 \end{cases} \]满足\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),则对任意\(\theta_1 \neq \theta_0\)、任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),有\[\mathbb{E}_{\theta_1}[\phi_2(X)] \geq \mathbb{E}_{\theta_1}[\tilde{\phi}(X)] \]
- UMPUT结论:上述\(\phi_2(x)\)是检验问题(iii)的一致最优无偏检验(UMPUT),即检验(iii)的UMPUT必为双边拒绝域形式,且满足约束\[\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha, \quad \mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \]
三、定理的分步严格证明
证明(1):双约束检验类中的一致最优性
步骤1:匹配推广N-P引理的记号
为应用推广的N-P引理,定义三个密度函数:
- 原假设密度:\(f_1(x) = f(x,\theta_0) = a(\theta_0)h(x)e^{Q(\theta_0)T(x)}\),对应第一个约束\(\int \phi f_1 d\mu = \alpha_1 = \alpha\);
- 辅助密度:\(f_2(x) = T(x)f(x,\theta_0) = T(x)a(\theta_0)h(x)e^{Q(\theta_0)T(x)}\),对应第二个约束\(\int \phi f_2 d\mu = \alpha_2 = \alpha\mathbb{E}_{\theta_0}[T(X)]\);
- 备择假设密度:\(f_3(x) = f(x,\theta_1) = a(\theta_1)h(x)e^{Q(\theta_1)T(x)}\),其中\(\theta_1 \neq \theta_0\)为任意备择点。
根据定义,对任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),恰好满足推广N-P引理的双等式约束:
步骤2:构造推广N-P引理的拒绝域
根据推广的N-P引理,最大化\(\mathbb{E}_{\theta_1}[\phi(X)]\)的检验,其拒绝域为:
将指数族密度代入,两边除以恒正的\(h(x)e^{Q(\theta_0)T(x)}\),化简得:
令\(b = Q(\theta_1)-Q(\theta_0)\)(因\(Q(\theta)\)严格单调,\(b\neq0\)),\(d_1 = \frac{c_1a(\theta_0)}{a(\theta_1)}\),\(d_2 = \frac{c_2a(\theta_0)}{a(\theta_1)}\),则拒绝域等价于:
步骤3:排除无效的拒绝域形式
指数函数\(e^{bt}\)与直线\(d_1+d_2t\)的交点数仅有3种可能,我们逐一排除不符合约束的情形:
- 无交点:此时\(e^{bt} > d_1+d_2t\)对所有\(t\)成立,\(R^+=\mathcal{X}\),即\(\phi_2(x)\equiv1\),此时\(\mathbb{E}_{\theta_0}[\phi_2]=1\),与\(0<\alpha<1\)矛盾,排除。
- 仅有1个交点:此时拒绝域为单边形式\(R^+=\{T(x)<k\}\)或\(\{T(x)>k\}\),对应的检验是单边检验。
单边检验的功效函数是关于\(\theta\)的严格单调函数,因此\(\beta'(\theta_0) \neq 0\),不满足无偏性的等价约束\(\mathbb{E}_{\theta_0}[\phi T] = \alpha\mathbb{E}_{\theta_0}[T]\),即无法满足\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),排除。 - 有2个交点:这是唯一可行的情形。设两个交点为\(k_1<k_2\),则\(e^{bt} > d_1+d_2t\)的解为\(t<k_1\)或\(t>k_2\),即拒绝域为:\[R^+ = \{x: T(x)<k_1 \text{ 或 } T(x)>k_2\} \]完全匹配双边拒绝域检验\(\phi_2(x)\)的形式。
步骤4:一致最优性证明
若\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),则满足推广N-P引理的双等式约束,根据推广N-P引理的结论(1),对任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),有:
即\(\mathbb{E}_{\theta_1}[\phi_2(X)] \geq \mathbb{E}_{\theta_1}[\tilde{\phi}(X)]\)。
同时,\(\phi_2(x)\)的形式与备择点\(\theta_1\)无关,因此该不等式对所有\(\theta_1 \neq \theta_0\)成立,即\(\phi_2(x)\)在\(\widetilde{\Phi}'_\alpha\)中是一致最优的。
证明(2):\(\phi_2(x)\)是检验(iii)的UMPUT
要证明\(\phi_2(x)\)是UMPUT,需完成两步:证明\(\phi_2(x)\)是无偏检验 + 证明\(\phi_2(x)\)在所有无偏检验中一致最优。
步骤1:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验
无偏检验要求:
- 原假设上:\(\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha\)(已由约束满足);
- 备择假设上:对任意\(\theta \neq \theta_0\),\(\mathbb{E}_\theta[\phi_2(X)] \geq \alpha\)。
取基准检验\(\tilde{\phi}(x) \equiv \alpha\),验证其属于\(\widetilde{\Phi}'_\alpha\):
- \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)] = \mathbb{E}_{\theta_0}[\alpha] = \alpha\),满足第一个约束;
- \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)T(X)] = \mathbb{E}_{\theta_0}[\alpha T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\),满足第二个约束。
因此\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),根据证明(1)的最优性结论,对任意\(\theta \neq \theta_0\),有:
完美满足无偏性要求,即\(\phi_2(x)\)是检验(iii)的水平为\(\alpha\)的无偏检验。
步骤2:证明在所有无偏检验中一致最优
设\(\tilde{\phi}(x)\)是检验(iii)的任意一个水平为\(\alpha\)的无偏检验,根据引理6.4.3,无偏检验必须满足:
- \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)] = \alpha\);
- \(\beta'(\theta_0)=0\),等价于\(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)。
因此\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),根据证明(1)的结论,对任意\(\theta \neq \theta_0\),有:
即\(\phi_2(x)\)在所有水平为\(\alpha\)的无偏检验中,对备择假设全空间的功效一致最高,因此\(\phi_2(x)\)是检验(iii)的UMPUT。
四、定理的核心意义与补充说明
1. 理论价值
- 彻底解决了点原假设双侧检验的最优性问题:证明了单参数指数族下,点原假设双侧检验的UMPUT必为双边拒绝域检验,给出了检验的标准形式与定解条件。
- 完成了双边检验的理论闭环:从单边检验的UMPT,到区间原假设双边检验的UMPT/UMPUT,再到点原假设双侧检验的UMPUT,形成了完整的单参数指数族假设检验最优性理论体系。
- 揭示了经典双侧检验的理论依据:我们常用的正态分布双侧z检验、t检验,二项分布双侧检验等,本质上都是该定理的特例,其最优性由该定理保证。
2. 应用说明
定理给出的定解条件\(\mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)在计算中可大幅简化:
- 若充分统计量\(T(X)\)的分布关于\(\mathbb{E}_{\theta_0}[T(X)]\)对称(如正态分布),可直接取对称临界值\(k_1 = \mathbb{E}[T] - k\),\(k_2 = \mathbb{E}[T] + k\),此时两个约束可合并为\(\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha\),无需额外计算第二个约束。
- 对于非对称分布(如指数分布、二项分布),需通过两个约束方程联立求解临界值\(k_1,k_2\)。
3. 与全局UMPT的区别
该定理得到的是UMPUT(一致最优无偏检验),而非全局UMPT,原因与检验(ii)一致:
检验构造中用到的推广N-P引理结论(1)仅对等式约束的检验类成立,无法覆盖所有水平为\(\alpha\)的检验,因此仅能在无偏检验类中得到最优性,不存在全局UMPT。
五、三类双边检验核心结论总结表
| 检验问题 | 原假设\(H_0\) | 备择假设\(H_1\) | 最优检验类型 | 检验形式 | 定解条件 |
|---|---|---|---|---|---|
| 检验(i) | \(\theta\leq\theta_1\) 或 \(\theta\geq\theta_2\) | \(\theta_1<\theta<\theta_2\) | 全局UMPT | 中间拒绝域:\(k_1<T<k_2\)时拒绝 | \(\mathbb{E}_{\theta_1}[\phi]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi]=\alpha\) |
| 检验(ii) | \(\theta_1\leq\theta\leq\theta_2\) | \(\theta<\theta_1\) 或 \(\theta>\theta_2\) | UMPUT | 双边拒绝域:\(T<k_1\)或\(T>k_2\)时拒绝 | \(\mathbb{E}_{\theta_1}[\phi]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi]=\alpha\) |
| 检验(iii) | \(\theta=\theta_0\) | \(\theta\neq\theta_0\) | UMPUT | 双边拒绝域:\(T<k_1\)或\(T>k_2\)时拒绝 | \(\mathbb{E}_{\theta_0}[\phi]=\alpha\) \(\mathbb{E}_{\theta_0}[\phi T]=\alpha\mathbb{E}_{\theta_0}[T]\) |
定理6.4.5 对称分布下双侧检验的简化UMPUT 完整讲解与证明
一、定理背景与核心价值
在定理6.4.4中,我们得到了点原假设双侧检验\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\)的UMPUT,但其需要两个联立的定解条件:
实际计算中需要通过这两个方程求解两个临界值\(k_1,k_2\),过程较为复杂。
而在数理统计的实际应用中,大量常见分布(如正态分布、t分布、对称二项分布等)的充分统计量\(T(X)\),在原假设\(\theta=\theta_0\)下服从对称分布。定理6.4.5正是针对这一高频场景,给出了简化的UMPUT形式,证明了对称场景下第二个定解条件会自动满足,仅需一个条件即可确定检验的临界值,大幅降低了计算难度。
二、定理6.4.5 正式表述
条件:同定理6.4.4,针对单参数指数族分布的点原假设双侧检验问题(iii),且当\(\theta=\theta_0\)时,充分统计量\(T=T(X)\)的分布关于点\(\mu_0\)对称。
结论:检验问题(iii)的UMPUT可表示为对称等尾形式:
其中临界值\(k\)和随机化参数\(\gamma\),仅由条件\(\mathbb{E}_{\theta_0}[\phi_2(T)] = \alpha\)唯一确定,第二个定解条件\(\mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)可自动满足,无需额外计算。
三、定理的分步严格证明
证明的核心目标:验证对称形式的检验函数\(\phi_2(t)\),会自动满足定理6.4.4的第二个定解条件,因此仅需一个约束即可确定检验。
步骤1:明确对称分布的核心性质
设\(\theta=\theta_0\)时,\(T(X)\)的概率密度为\(g(t)\)(离散分布可替换为分布律,证明逻辑完全一致),分布关于\(\mu_0\)对称,即满足两个核心性质:
- 密度对称性:对任意\(\tau\),有\(g(\mu_0 + \tau) = g(\mu_0 - \tau)\),即\(g(\mu_0+\tau)\)是关于\(\tau\)的偶函数;
- 期望匹配对称中心:若\(T\)的期望存在,则\(\mathbb{E}_{\theta_0}[T(X)] = \mu_0\)(对称分布的期望等于其对称中心)。
同时,我们构造的检验函数\(\phi_2(t)\)仅由\(|t-\mu_0|\)决定,因此也关于\(\mu_0\)对称,即\(\phi_2(\mu_0+\tau) = \phi_2(\mu_0-\tau)\),\(\phi_2(\mu_0+\tau)\)也是关于\(\tau\)的偶函数。
步骤2:展开目标期望的积分式
我们需要验证的第二个定解条件为\(\mathbb{E}_{\theta_0}[\phi_2(T)T] = \alpha\mathbb{E}_{\theta_0}[T]\),根据期望的定义展开:
做变量替换,令\(t = \mu_0 + \tau\),则\(dt=d\tau\),积分上下限不变,代入后拆分积分:
步骤3:分别计算两个积分项
第一项积分:匹配定解条件
对第一项做变量回代\(\tau = t-\mu_0\),积分可还原为期望形式:
根据检验的水平约束,\(\mathbb{E}_{\theta_0}[\phi_2(T)] = \alpha\),且对称分布满足\(\mathbb{E}_{\theta_0}[T] = \mu_0\),因此第一项可化简为:
这正是我们需要验证的定解条件的右侧。
第二项积分:奇函数的对称积分等于0
令被积函数\(h(\tau) = \tau \cdot \phi_2(\mu_0+\tau) \cdot g(\mu_0+\tau)\),我们证明\(h(\tau)\)是关于\(\tau\)的奇函数:
根据积分性质,奇函数在对称区间\((-\infty,+\infty)\)上的定积分恒为0,因此第二项积分:
步骤4:合并结果完成证明
将两项积分的结果合并,得到:
这说明对称形式的检验函数\(\phi_2(t)\),自动满足定理6.4.4的第二个定解条件。结合定理6.4.4的结论,\(\phi_2(t)\)满足UMPUT的所有要求,因此是检验问题(iii)的UMPUT,且仅需通过\(\mathbb{E}_{\theta_0}[\phi_2(T)]=\alpha\)即可确定临界值\(k\)和随机化参数\(\gamma\)。
四、定理的核心应用与经典实例
该定理是绝大多数常用双侧检验的理论依据,我们以最经典的正态分布双侧检验为例说明:
实例1:正态总体均值的双侧z检验
设样本\(X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)\),其中\(\sigma^2\)已知,检验问题为:
- 充分统计量为样本均值\(\bar{X}\),在\(H_0\)下,\(\bar{X} \sim N\left(\mu_0, \frac{\sigma^2}{n}\right)\),分布关于\(\mu_0\)对称,符合定理6.4.5的条件。
- 根据定理,UMPUT为对称等尾形式:当\(|\bar{X}-\mu_0|>k\)时拒绝\(H_0\)。
- 临界值\(k\)仅由水平条件\(\mathbb{P}_{\mu_0}(|\bar{X}-\mu_0|>k)=\alpha\)确定,解得\(k = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\),其中\(z_{\alpha/2}\)为标准正态分布的上\(\alpha/2\)分位数。
这就是我们日常使用的双侧z检验,定理6.4.5严格证明了该检验是无偏检验类中的一致最优检验。
实例2:正态总体均值的双侧t检验
设样本\(X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)\),其中\(\sigma^2\)未知,检验问题同上。
- 构造检验统计量\(t = \frac{\bar{X}-\mu_0}{S/\sqrt{n}}\)(\(S\)为样本标准差),在\(H_0\)下,\(t\)服从自由度为\(n-1\)的t分布,分布关于0对称,符合定理条件。
- UMPUT为对称等尾形式:当\(|t|>k\)时拒绝\(H_0\),临界值\(k=t_{\alpha/2}(n-1)\),即t分布的上\(\alpha/2\)分位数,仅由水平条件\(\mathbb{P}(|t|>k)=\alpha\)确定。
五、定理的核心意义总结
- 计算简化:将对称分布下双侧检验的两个定解条件合并为一个,无需求解复杂的联立方程,大幅降低了实际应用的计算成本。
- 理论支撑:为经典的双侧z检验、t检验、对称分布的双侧卡方检验等常用方法,提供了严格的最优性理论依据,证明了这些检验在无偏检验类中是一致最优的。
- 实践指导:明确了对称分布下双侧检验的最优形式是等尾对称拒绝域,解释了为什么实际应用中双侧检验几乎都采用等尾临界值,而非非对称的临界值组合。
- 适用范围:不仅适用于连续对称分布,对离散对称分布(如\(p=0.5\)的二项分布)同样适用,仅需通过随机化参数\(\gamma\)匹配显著性水平\(\alpha\)即可。
小节归纳
单参数指数族双边检验 全知识点汇总表
以下表格完整覆盖上述所有核心知识点,从基础概念、检验分类、核心引理、关键定理、维度对比到实际应用,形成完整的知识体系。
表1 核心基础概念定义表
| 术语 | 符号/数学定义 | 核心含义 |
|---|---|---|
| 单参数指数族 | \(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\) | 数理统计核心分布族,\(Q(\theta)\)为\(\theta\)的严格增函数,\(T(x)\)是\(\theta\)的充分统计量,包含样本中关于\(\theta\)的全部信息 |
| 检验函数 | \(\phi(x)\) | 观测到样本\(x\)时拒绝原假设\(H_0\)的概率,满足\(0\leq\phi(x)\leq1\);非随机化检验中仅取0(接受)或1(拒绝) |
| 功效函数 | \(\beta(\theta) = \mathbb{E}_\theta[\phi(X)]\) | 参数为\(\theta\)时拒绝\(H_0\)的概率;原假设上为第一类错误概率,备择假设上\(1-\beta(\theta)\)为第二类错误概率 |
| 水平为\(\alpha\)的检验 | 对所有\(\theta\in\Theta_0\),\(\beta(\theta)\leq\alpha\) | 原假设成立时,错误拒绝\(H_0\)的概率不超过显著性水平\(\alpha\) |
| 无偏检验 | 原假设上\(\beta(\theta)\leq\alpha\);备择假设上\(\beta(\theta)\geq\alpha\) | 备择假设成立时拒绝\(H_0\)的概率,不低于原假设成立时错误拒绝的概率,保证检验对备择假设的识别能力 |
| UMPT(一致最优检验) | 所有水平为\(\alpha\)的检验中,对任意\(\theta\in\Theta_1\),\(\beta(\theta)\)一致最大的检验 | 全检验类中的全局最优检验,在备择全空间上功效最高 |
| UMPUT(一致最优无偏检验) | 所有水平为\(\alpha\)的无偏检验中,对任意\(\theta\in\Theta_1\),\(\beta(\theta)\)一致最大的检验 | 无偏检验类中的局部最优检验,双边检验无全局UMPT时的最优解 |
表2 三类标准双边检验问题汇总表
| 检验编号 | 别称 | 原假设\(H_0\) | 备择假设\(H_1\) | 核心特征 |
|---|---|---|---|---|
| (i) | 带内检验/区间备择检验 | \(\theta\leq\theta_1\) 或 \(\theta\geq\theta_2\) | \(\theta_1<\theta<\theta_2\) | 备择假设在原假设的中间区间,功效函数为「两头小中间大」的单峰凹函数 |
| (ii) | 带外检验/区间原假设检验 | \(\theta_1\leq\theta\leq\theta_2\) | \(\theta<\theta_1\) 或 \(\theta>\theta_2\) | 备择假设在原假设的两侧区间,功效函数为「中间小两头大」的凸函数 |
| (iii) | 点原假设双侧检验 | \(\theta=\theta_0\) | \(\theta\neq\theta_0\) | 检验(ii)的特例(\(\theta_1=\theta_2=\theta_0\)),最常用的双侧检验,功效函数以\(\theta_0\)为极小值点的凸函数 |
表3 核心引理汇总表
| 引理名称 | 核心适用场景 | 核心内容与结论 | 理论价值 |
|---|---|---|---|
| 推广的Neyman-Pearson引理 | 多约束条件下的最优势检验(MPT)构造 | 最优检验拒绝域为\(f_3(x) > c_1f_1(x)+c_2f_2(x)\); 1. 等式约束:\(c_1,c_2\)可正可负,仅对等式约束检验类最优; 2. 不等式约束:要求\(c_1,c_2\geq0\),对所有水平为\(\alpha\)的检验最优 |
双边检验最优性的核心工具,是经典N-P引理在多约束场景的推广,解决了两点原假设检验的MPT构造问题 |
| 引理6.4.1 | 两点原假设、中间备择检验(检验(i)'/(i)'') | 中间拒绝域检验\(\phi_1(x)\)(\(k_1<T<k_2\)时拒绝),满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\)时,是所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)的检验中的MPT | 证明了中间拒绝域检验在全检验类中的最优性,为检验(i)的全局UMPT奠定基础 |
| 引理6.4.2 | 两点原假设、两侧备择检验(检验(ii)'/(ii)'') | 双边拒绝域检验\(\phi_2(x)\)(\(T<k_1\)或\(T>k_2\)时拒绝),满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\)时,是所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)的检验中的MPT | 证明了双边拒绝域检验在等式约束检验类中的最优性,为检验(ii)的UMPUT奠定基础 |
| 引理6.4.3 | 点原假设双侧检验(iii)的无偏检验约束 | 1. 充分统计量期望:\(\mathbb{E}_\theta[T] = -\frac{a'(\theta)}{a(\theta)Q'(\theta)}\); 2. 功效函数导数:\(\beta'(\theta) = Q'(\theta)\left[\mathbb{E}_\theta[\phi T] - \mathbb{E}_\theta[T]\mathbb{E}_\theta[\phi]\right]\); 3. 无偏检验等价条件:\(\beta'(\theta_0)=0 \iff \mathbb{E}_{\theta_0}[\phi T] = \alpha\mathbb{E}_{\theta_0}[T]\) |
解决了点原假设双侧检验定解条件不足的问题,给出了第二个约束的可计算形式,为检验(iii)的UMPUT提供核心约束 |
表4 四大核心定理汇总表
| 定理编号 | 对应检验问题 | 最优检验类型 | 检验拒绝域形式 | 定解条件 | 核心价值 |
|---|---|---|---|---|---|
| 6.4.2 | 检验(i) 带内检验 | 全局UMPT | 中间区间拒绝:\(k_1<T<k_2\)时拒绝\(H_0\) | \(\mathbb{E}_{\theta_1}[\phi]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi]=\alpha\) |
证明了带内检验存在全局UMPT,是双边检验中唯一的全局最优检验 |
| 6.4.3 | 检验(ii) 带外检验 | UMPUT(无全局UMPT) | 双侧区间拒绝:\(T<k_1\) 或 \(T>k_2\)时拒绝\(H_0\) | \(\mathbb{E}_{\theta_1}[\phi]=\alpha\) \(\mathbb{E}_{\theta_2}[\phi]=\alpha\) |
证明了区间原假设双侧检验的UMPUT存在性与构造方法,明确了无偏检验类中的最优形式 |
| 6.4.4 | 检验(iii) 点原假设双侧检验 | UMPUT(无全局UMPT) | 双侧区间拒绝:\(T<k_1\) 或 \(T>k_2\)时拒绝\(H_0\) | \(\mathbb{E}_{\theta_0}[\phi]=\alpha\) \(\mathbb{E}_{\theta_0}[\phi T]=\alpha\mathbb{E}_{\theta_0}[T]\) |
彻底解决了点原假设双侧检验的最优性问题,证明了常用双侧检验的UMPUT性质 |
| 6.4.5 | 检验(iii) 对称分布场景 | UMPUT(简化形式) | 对称等尾拒绝:$ | T-\mu_0 | >k\(时拒绝\)H_0$ |
表5 三类双边检验核心维度对比表
| 对比维度 | 检验(i) 带内检验 | 检验(ii) 带外检验 | 检验(iii) 点原假设双侧检验 |
|---|---|---|---|
| 原假设参数空间 | \(\theta\leq\theta_1\) 或 \(\theta\geq\theta_2\) | \(\theta_1\leq\theta\leq\theta_2\) | \(\theta=\theta_0\) |
| 备择假设参数空间 | \(\theta_1<\theta<\theta_2\) | \(\theta<\theta_1\) 或 \(\theta>\theta_2\) | \(\theta\neq\theta_0\) |
| 最优检验类型 | 全局UMPT | UMPUT(无全局UMPT) | UMPUT(无全局UMPT) |
| 检验拒绝域形式 | 中间区间拒绝 | 双侧区间拒绝 | 双侧区间拒绝(对称分布下为等尾对称拒绝) |
| 定解条件数量 | 2个边界等式约束 | 2个边界等式约束 | 2个约束,对称分布下简化为1个 |
| 功效函数形态 | 单峰凹函数,「两头小中间大」 | 凸函数,「中间小两头大」 | 凸函数,以\(\theta_0\)为极小值点 |
| 最优性覆盖范围 | 所有水平为\(\alpha\)的检验 | 仅水平为\(\alpha\)的无偏检验 | 仅水平为\(\alpha\)的无偏检验 |
| 核心理论依据 | 推广N-P引理结论(2)(\(c_1,c_2\geq0\)) | 推广N-P引理结论(1) | 推广N-P引理结论(1)+引理6.4.3 |
表6 实际应用场景与经典案例表
| 分布类型 | 检验问题 | 核心统计量 | 最优检验类型 | 经典检验形式 | 定解方式 |
|---|---|---|---|---|---|
| 正态分布\(N(\mu,\sigma^2)\)(\(\sigma^2\)已知) | \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\) | 样本均值\(\bar{X}\) | UMPUT(对称简化形式) | 双侧z检验:\(|\bar{X}-\mu_0|>z_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}\)时拒绝 | 仅由\(\mathbb{P}_{\mu_0}(|\bar{X}-\mu_0|>k)=\alpha\)确定临界值 |
| 正态分布\(N(\mu,\sigma^2)\)(\(\sigma^2\)未知) | \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\) | 样本均值\(\bar{X}\)、样本标准差\(S\) | UMPUT(对称简化形式) | 双侧t检验:\(\left|\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\right|>t_{\alpha/2}(n-1)\)时拒绝 | 仅由\(\mathbb{P}_{\mu_0}(|t|>k)=\alpha\)确定临界值 |
| 二项分布\(Bin(n,p)\) | \(H_0:p=p_0 \leftrightarrow H_1:p\neq p_0\) | 成功次数\(X\) | UMPUT | 双侧拒绝域:\(X<k_1\)或\(X>k_2\)时拒绝 | 联立水平约束+无偏性约束确定临界值 |
| 指数分布\(Exp(\lambda)\) | \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda\neq\lambda_0\) | 样本和\(\sum_{i=1}^n X_i\) | UMPUT | 双侧拒绝域:\(\sum X_i<k_1\)或\(\sum X_i>k_2\)时拒绝 | 联立水平约束+无偏性约束确定临界值 |
| 泊松分布\(Pois(\lambda)\) | \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda\neq\lambda_0\) | 样本和\(\sum_{i=1}^n X_i\) | UMPUT | 双侧拒绝域:\(\sum X_i<k_1\)或\(\sum X_i>k_2\)时拒绝 | 联立水平约束+无偏性约束确定临界值 |
posted on 2026-03-03 07:25 Indian_Mysore 阅读(1) 评论(0) 收藏 举报
浙公网安备 33010602011771号