昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.4单参数指数族分布的双边检验

单参数指数族分布的双边检验 详细讲解与推导证明

我将以多年数理统计教学与研究的视角,从问题起源、核心概念、严格推导到最终总结,完整讲解该知识点,确保逻辑连贯、推导严谨、结论清晰。

一、问题起源:为什么双边检验不能直接用单边的UMPT?

上一节我们已经证明:对于单调似然比分布族,单边假设检验问题存在一致最优检验(UMPT),其核心是单边检验的功效函数是关于参数\(\theta\)的单调函数,能在备择假设的整个参数空间上实现功效一致最优。

但双边检验与单边检验有本质区别:
双边检验的备择假设分布在原假设的两侧,其功效函数无法是单调函数:

  • 若备择假设是中间区间(\(H_1:\theta_1<\theta<\theta_2\)),功效函数需要满足「两头小、中间大」;
  • 若备择假设是两侧区间(\(H_1:\theta<\theta_1\)\(\theta>\theta_2\)),功效函数需要满足「中间小、两头大」。

单调的单边检验功效函数无法满足上述形态,因此双边检验问题不存在全局的UMPT。我们需要缩小检验的范围,引入「无偏检验」的约束,在无偏检验类中寻找一致最优的检验,即一致最优无偏检验(UMPUT)

二、双边检验的三类核心问题形式

设总体\(X \sim f(x,\theta), \theta \in \mathbb{R}\),双边检验分为三类标准形式:

  1. 问题(i) 带内检验\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\)
  2. 问题(ii) 带外检验\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
  3. 问题(iii) 点原假设双侧检验\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\)

其中问题(iii)是问题(ii)的特例(令\(\theta_1=\theta_2=\theta_0\)),也是实际应用中最常见的形式。

三、核心概念:无偏检验与UMPUT

3.1 功效函数的核心意义

检验函数\(\phi(x)\)的功效函数定义为:

\[\beta_\phi(\theta) = \mathbb{E}_\theta[\phi(X)] \]

它表示「当参数为\(\theta\)时,拒绝原假设\(H_0\)的概率」。一个合格的水平为\(\alpha\)的检验,必须满足:

  • 在原假设\(H_0\)的参数空间上:\(\beta_\phi(\theta) \leq \alpha\)(第一类错误概率不超过显著性水平\(\alpha\));
  • 在备择假设\(H_1\)的参数空间上:\(\beta_\phi(\theta)\)应尽可能大(第二类错误概率\(1-\beta_\phi(\theta)\)尽可能小)。

3.2 无偏检验的定义

一个水平为\(\alpha\)的检验\(\phi(x)\),若满足:在备择假设\(H_1\)上,\(\beta_\phi(\theta) \geq \alpha\),则称\(\phi(x)\)为水平为\(\alpha\)的无偏检验。

定义的合理性

若一个检验在\(H_1\)上的功效小于\(\alpha\),意味着「\(H_1\)成立时拒绝\(H_0\)的概率,比\(H_0\)成立时错误拒绝\(H_0\)的概率还小」,这是完全不合理的,相当于检验对备择假设没有识别能力,是「有偏」的。

所有水平为\(\alpha\)的无偏检验构成的集合,称为无偏检验类,记为:

\[\Phi_\alpha^* = \left\{ \phi: \mathbb{E}_\theta[\phi(X)] \leq \alpha, \theta\in\Theta_0; \ \mathbb{E}_\theta[\phi(X)] \geq \alpha, \theta\in\Theta_1 \right\} \]

3.3 一致最优无偏检验(UMPUT)

若检验\(\phi(x) \in \Phi_\alpha^*\),且对任意的\(\tilde{\phi}(x) \in \Phi_\alpha^*\),都有:

\[\beta_\phi(\theta) \geq \beta_{\tilde{\phi}}(\theta), \quad \forall \theta \in \Theta_1 \]

则称\(\phi(x)\)为该检验问题的一致最优无偏检验,记为UMPUT。

简单来说,UMPUT就是在所有无偏检验中,在备择假设的全空间上功效都最高的检验,是双边检验问题的最优解。

3.4 无偏检验的关键边界性质

对于指数族分布,其功效函数\(\beta(\theta)\)是关于\(\theta\)的连续可导函数,结合无偏性定义,可得到两个核心边界条件,是后续构造检验的核心约束:

  1. 对于问题(i)和(ii),无偏检验必须满足:

    \[\beta(\theta_1) = \mathbb{E}_{\theta_1}[\phi(X)] = \alpha, \quad \beta(\theta_2) = \mathbb{E}_{\theta_2}[\phi(X)] = \alpha \]

    证明:由连续性,\(\theta \to \theta_1^+\)(问题(i))或\(\theta \to \theta_1^-\)(问题(ii))时,\(\beta(\theta) \to \beta(\theta_1)\),而无偏性要求\(\beta(\theta) \geq \alpha\),同时\(H_0\)要求\(\beta(\theta_1) \leq \alpha\),因此只能取等号,\(\theta_2\)同理。

  2. 对于问题(iii),无偏检验必须满足:

    \[\beta(\theta_0) = \mathbb{E}_{\theta_0}[\phi(X)] = \alpha, \quad \beta'(\theta_0) = \frac{d}{d\theta}\beta(\theta)\bigg|_{\theta=\theta_0} = 0 \]

    证明:\(\beta(\theta_0)=\alpha\)的推导同上;而\(\theta_0\)是功效函数的极小值点(中间小、两头大),因此在该点的导数为0。

四、单参数指数族的标准形式

我们的研究对象是单参数指数族分布,其概率密度(分布律)的标准形式为:

\[f(x,\theta) = C(\theta) \exp\left\{ Q(\theta) T(x) \right\} h(x) \]

其中:

  • \(Q(\theta)\)\(\theta\)的严格单调递增函数(若不满足,可通过参数变换转化为自然参数形式);
  • \(T(x)\)是参数\(\theta\)的充分统计量,包含了样本中关于\(\theta\)的所有信息;
  • \(h(x) \geq 0\)为支撑函数,\(C(\theta) > 0\)为归一化常数。

为简化推导,引入自然参数\(\eta = Q(\theta)\),则指数族可转化为自然形式:

\[f(x,\eta) = C(\eta) \exp\left\{ \eta T(x) \right\} h(x) \]

此时\(\eta\)\(\theta\)一一对应,假设检验问题可等价转化为关于\(\eta\)的检验,最优检验必然基于充分统计量\(T=T(X)\)构造。

五、三类双边检验的UMPUT推导与证明

5.1 问题(iii):\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\) 的UMPUT

这是最常用的双侧检验,我们先完成其完整推导。

步骤1:转化为自然参数的约束条件

检验问题转化为\(H_0:\eta=\eta_0 \longleftrightarrow H_1:\eta\neq\eta_0\),其中\(\eta_0=Q(\theta_0)\)
结合无偏检验的边界条件,检验需满足两个约束:

  1. 水平条件:\(\mathbb{E}_{\eta_0}[\phi(T)] = \alpha\)
  2. 导数条件:\(\beta'(\eta_0) = 0\)

步骤2:推导功效函数的导数表达式

对于指数族,充分统计量\(T\)的分布仍为指数族,密度为:

\[f_T(t,\eta) = C(\eta) \exp\left\{ \eta t \right\} h_T(t) \]

功效函数为:

\[\beta(\eta) = \mathbb{E}_\eta[\phi(T)] = \int \phi(t) C(\eta) e^{\eta t} h_T(t) dt \]

\(\eta\)求导(指数族满足正则条件,积分与求导可交换):

\[\beta'(\eta) = C'(\eta) \int \phi(t) e^{\eta t} h_T(t) dt + C(\eta) \int \phi(t) t e^{\eta t} h_T(t) dt \]

由密度的归一性\(\int C(\eta) e^{\eta t} h_T(t) dt = 1\),对\(\eta\)求导得:

\[\frac{C'(\eta)}{C(\eta)} = - \mathbb{E}_\eta[T] \]

将其代入导数表达式,化简得核心结论:

\[\beta'(\eta) = \text{Cov}_\eta\left( \phi(T), T \right) = \mathbb{E}_\eta[\phi(T)T] - \mathbb{E}_\eta[\phi(T)]\mathbb{E}_\eta[T] \]

因此,导数条件\(\beta'(\eta_0)=0\)等价于:

\[\mathbb{E}_{\eta_0}[\phi(T)T] = \alpha \cdot \mathbb{E}_{\eta_0}[T] \]

步骤3:基于广义NP引理构造最优检验

我们的目标是:在满足上述两个约束的检验中,找到对任意\(\eta\neq\eta_0\)\(\beta(\eta)\)最大的检验。

根据广义Neyman-Pearson引理(带多个约束的最优检验构造),对任意固定的\(\eta_1\neq\eta_0\),最大化\(\mathbb{E}_{\eta_1}[\phi(T)]\)的检验,其拒绝域由似然比决定:

\[\frac{f(t,\eta_1)}{f(t,\eta_0)} = \frac{C(\eta_1)}{C(\eta_0)} \exp\left\{ (\eta_1-\eta_0)t \right\} \]

该似然比是关于\(t\)的指数函数,而约束条件是线性的,因此方程\(\frac{f(t,\eta_1)}{f(t,\eta_0)} = k_1 + k_2 t\)最多有两个解\(c_1,c_2\)\(c_1<c_2\))。无论\(\eta_1>\eta_0\)还是\(\eta_1<\eta_0\),不等式的解均为\(t<c_1\)\(t>c_2\),且该形式与\(\eta_1\)无关,满足「一致最优」的要求。

步骤4:最终的UMPUT形式

问题(iii)的UMPUT为:

\[\phi(t) = \begin{cases} 1, & t < c_1 \text{ 或 } t > c_2 \\ \gamma_1, & t = c_1 \\ \gamma_2, & t = c_2 \\ 0, & c_1 < t < c_2 \end{cases} \]

其中临界值\(c_1,c_2\)和随机化参数\(\gamma_1,\gamma_2\),由以下两个约束唯一确定:

\[\begin{cases} \mathbb{E}_{\eta_0}[\phi(T)] = \alpha \\ \mathbb{E}_{\eta_0}[\phi(T)T] = \alpha \cdot \mathbb{E}_{\eta_0}[T] \end{cases} \]

补充说明:

  • 连续分布:\(P(T=c_1)=P(T=c_2)=0\),因此\(\gamma_1=\gamma_2=0\),无需随机化;
  • 对称分布:若\(T\)的分布关于\(\mathbb{E}_{\eta_0}[T]\)对称,可直接取\(c_1 = \mathbb{E}[T] - k\)\(c_2 = \mathbb{E}[T] + k\),两个约束可简化为一个,例如正态分布的双侧z检验、t检验。

5.2 问题(ii):\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\) 的UMPUT

步骤1:约束条件

转化为自然参数的检验问题\(H_0:\eta_1\leq\eta\leq\eta_2 \longleftrightarrow H_1:\eta<\eta_1 \text{ 或 } \eta>\eta_2\),无偏检验的约束为边界条件:

\[\mathbb{E}_{\eta_1}[\phi(T)] = \alpha, \quad \mathbb{E}_{\eta_2}[\phi(T)] = \alpha \]

步骤2:检验形式与证明

同样通过广义NP引理,对任意\(\eta\notin[\eta_1,\eta_2]\),最优检验的拒绝域为\(t<c_1\)\(t>c_2\),与\(\eta\)无关,因此是一致最优的。

最终的UMPUT形式与问题(iii)完全一致:

\[\phi(t) = \begin{cases} 1, & t < c_1 \text{ 或 } t > c_2 \\ \gamma_1, & t = c_1 \\ \gamma_2, & t = c_2 \\ 0, & c_1 < t < c_2 \end{cases} \]

其中\(c_1,c_2,\gamma_1,\gamma_2\)由约束\(\mathbb{E}_{\eta_1}[\phi(T)] = \alpha\)\(\mathbb{E}_{\eta_2}[\phi(T)] = \alpha\)唯一确定。

最优性证明

  1. 水平有效性:指数族的功效函数\(\beta(\eta)\)是关于\(\eta\)的凸函数,凸函数在区间\([\eta_1,\eta_2]\)上的最大值在端点取得,因此\(\forall \eta\in[\eta_1,\eta_2]\)\(\beta(\eta)\leq\alpha\),满足水平要求;
  2. 无偏性:对\(\eta<\eta_1\)\(\eta>\eta_2\),由凸函数性质,\(\beta(\eta)\geq\alpha\),满足无偏性;
  3. 一致最优性:对任意无偏检验\(\tilde{\phi}\),其必然满足边界条件,由广义NP引理,\(\phi\)在所有\(\eta\notin[\eta_1,\eta_2]\)上功效最大,因此是UMPUT。

5.3 问题(i):\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\) 的UMPUT

步骤1:约束条件

转化为自然参数的检验问题\(H_0:\eta\leq\eta_1 \text{ 或 } \eta\geq\eta_2 \longleftrightarrow H_1:\eta_1<\eta<\eta_2\),约束仍为边界条件:

\[\mathbb{E}_{\eta_1}[\phi(T)] = \alpha, \quad \mathbb{E}_{\eta_2}[\phi(T)] = \alpha \]

步骤2:检验形式

该问题的备择假设是中间区间,因此最优检验的拒绝域为中间区间,接受域为两侧,最终的UMPUT形式为:

\[\phi(t) = \begin{cases} 1, & c_1 < t < c_2 \\ \gamma_1, & t = c_1 \\ \gamma_2, & t = c_2 \\ 0, & t < c_1 \text{ 或 } t > c_2 \end{cases} \]

其中\(c_1,c_2,\gamma_1,\gamma_2\)由约束\(\mathbb{E}_{\eta_1}[\phi(T)] = \alpha\)\(\mathbb{E}_{\eta_2}[\phi(T)] = \alpha\)唯一确定。

最优性证明

该问题的功效函数是关于\(\eta\)的凹函数,在区间\((\eta_1,\eta_2)\)\(\beta(\eta)\geq\alpha\)(满足无偏性),区间外\(\beta(\eta)\leq\alpha\)(满足水平要求),且在区间内的功效一致高于其他无偏检验,因此是UMPUT。

六、核心知识点总结表格

检验问题编号 原假设 \(H_0\) 备择假设 \(H_1\) UMPUT检验函数形式(基于充分统计量\(T=T(X)\) 检验的约束条件 功效函数核心性质
(i) 带内检验 \(\theta\leq\theta_1\)\(\theta\geq\theta_2\) \(\theta_1<\theta<\theta_2\) $$\phi(t)=\begin{cases}1, & c_1<t<c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & t<c_1 \text{ 或 } t>c_2\end{cases}$$ \(\mathbb{E}_{\theta_1}[\phi(T)]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi(T)]=\alpha\)
凹函数,「两头小中间大」,在\((\theta_1,\theta_2)\)\(\beta(\theta)\geq\alpha\),区间外\(\beta(\theta)\leq\alpha\)
(ii) 带外检验 \(\theta_1\leq\theta\leq\theta_2\) \(\theta<\theta_1\)\(\theta>\theta_2\) $$\phi(t)=\begin{cases}1, & t<c_1 \text{ 或 } t>c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & c_1<t<c_2\end{cases}$$ \(\mathbb{E}_{\theta_1}[\phi(T)]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi(T)]=\alpha\)
凸函数,「中间小两头大」,在\((\theta_1,\theta_2)\)\(\beta(\theta)\leq\alpha\),区间外\(\beta(\theta)\geq\alpha\)
(iii) 点原假设双侧检验 \(\theta=\theta_0\) \(\theta\neq\theta_0\) $$\phi(t)=\begin{cases}1, & t<c_1 \text{ 或 } t>c_2 \ \gamma_1, & t=c_1 \ \gamma_2, & t=c_2 \ 0, & c_1<t<c_2\end{cases}$$ \(\mathbb{E}_{\theta_0}[\phi(T)]=\alpha\)
\(\mathbb{E}_{\theta_0}[\phi(T)T]=\alpha \mathbb{E}_{\theta_0}[T]\)(或\(\beta'(\theta_0)=0\)
凸函数,\(\theta_0\)为极小值点,\(\beta(\theta_0)=\alpha\)\(\theta\neq\theta_0\)\(\beta(\theta)\geq\alpha\)

七、补充说明与应用实例

  1. 正态分布双侧z检验:设\(X_1,\dots,X_n \sim N(\mu,\sigma^2)\)\(\sigma^2\)已知,检验\(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\)。充分统计量为\(\bar{X}\),属于指数族,其UMPUT就是经典的双侧z检验,拒绝域为\(|\bar{X}-\mu_0| > z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\),完全符合上述推导的形式。
  2. 二项分布双侧检验:设\(X \sim Bin(n,p)\),检验\(H_0:p=p_0 \leftrightarrow H_1:p\neq p_0\),属于指数族,其UMPUT的拒绝域为\(X<c_1\)\(X>c_2\),通过两个约束条件确定临界值与随机化参数,解决离散分布的显著性水平匹配问题。
  3. 核心结论:单参数指数族的双边检验问题不存在全局UMPT,但在无偏检验类中,一定存在UMPUT,且检验形式均基于充分统计量构造,由无偏性的边界条件唯一确定临界值。

指数族分布双边检验:推广N-P引理与检验(i)的UMPT完整推导

承接上一讲的内容,本部分我们将完整讲解双边检验最优性的核心工具——推广的Neyman-Pearson引理,并基于该引理完成指数族分布下双边检验(i)的UMPT(一致最优检验)的严格推导,明确三类双边检验的最优性差异。

一、推广的Neyman-Pearson引理(定理6.4.1):背景与完整证明

1.1 引理的背景意义

经典的Neyman-Pearson(N-P)引理仅能解决单点原假设↔单点备择假设的最优势检验(MPT)问题,仅含1个第一类错误概率的约束条件。
而双边检验的原假设包含两个参数点(如\(H_0:\theta=\theta_1\)\(\theta=\theta_2\)),对应2个约束条件,因此必须将N-P引理推广到多约束场景,这是构造双边检验最优检验的核心工具。

1.2 引理的正式表述

设概率密度\(f_i(x),i=1,2,3\)关于测度\(\mu(x)\)可积,检验函数满足\(0\leq\phi(x)\leq1\)\(\phi(x)\)为观测到\(x\)时拒绝原假设的概率)。
定义两类检验类:

  • 等式约束检验类:\(\Phi'_\alpha = \left\{ \phi: \int_{\mathcal{X}} \phi(x)f_i(x)d\mu(x) = \alpha_i, i=1,2 \right\}\)(原假设两点的第一类错误概率严格等于\(\alpha\)
  • 不等式约束检验类:\(\Phi_\alpha = \left\{ \phi: \int_{\mathcal{X}} \phi(x)f_i(x)d\mu(x) \leq \alpha_i, i=1,2 \right\}\)(原假设两点的第一类错误概率不超过\(\alpha\)

定义检验函数:

\[\phi(x) = \begin{cases} 1, & x \in R^+ = \{x: f_3(x) > c_1f_1(x) + c_2f_2(x)\} \\ \gamma, & x \in R^0 = \{x: f_3(x) = c_1f_1(x) + c_2f_2(x)\} \\ 0, & x \in R^- = \{x: f_3(x) < c_1f_1(x) + c_2f_2(x)\} \end{cases} \]

其中\(f_1,f_2\)对应原假设两点的密度,\(f_3\)对应备择假设的密度,\(c_1,c_2\)为拉格朗日常数,\(\gamma\)为随机化参数。

引理的两个核心结论:

  1. 若存在常数\(c_1,c_2\)(可正可负)和\(\gamma\),使得\(\phi(x) \in \Phi'_\alpha\),则对任意\(\tilde{\phi}(x) \in \Phi'_\alpha\),有

    \[\int_{\mathcal{X}} \phi(x)f_3(x)d\mu(x) \geq \int_{\mathcal{X}} \tilde{\phi}(x)f_3(x)d\mu(x) \]

    \(\phi(x)\)是等式约束下的MPT。
  2. 若存在常数\(c_1\geq0, c_2\geq0\)\(\gamma\),使得\(\phi(x) \in \Phi'_\alpha\),则对任意\(\tilde{\phi}(x) \in \Phi_\alpha\),上述不等式仍成立,即\(\phi(x)\)是不等式约束下的MPT。
    同时,\(\phi(x)\)\(R^+ \cup R^-\)上几乎处处唯一。

1.3 完整证明过程

证明核心思路与经典N-P引理一致:通过构造非负差值函数,利用积分的保号性证明功效的最优性。

步骤1:构造非负差值函数

\[A(x) = [\phi(x) - \tilde{\phi}(x)] \cdot [f_3(x) - c_1f_1(x) - c_2f_2(x)] \]

分析\(A(x)\)的符号:

  • \(x \in R^+\)\(f_3 > c_1f_1 + c_2f_2\),且\(\phi(x)=1\)\(\tilde{\phi}(x)\leq1\),故\(\phi-\tilde{\phi}\geq0\),因此\(A(x)\geq0\)
  • \(x \in R^-\)\(f_3 < c_1f_1 + c_2f_2\),且\(\phi(x)=0\)\(\tilde{\phi}(x)\geq0\),故\(\phi-\tilde{\phi}\leq0\),因此\(A(x)\geq0\)
  • \(x \in R^0\)\(f_3 = c_1f_1 + c_2f_2\),因此\(A(x)=0\)

综上,对所有\(x\)\(A(x)\geq0\),因此积分满足:

\[\int_{\mathcal{X}} A(x)d\mu(x) = \int_{R^+ \cup R^-} A(x)d\mu(x) \geq 0 \]

步骤2:展开积分得到核心不等式

\(A(x)\)代入积分并展开,移项后得到:

\[\begin{aligned} \int_{\mathcal{X}} \phi f_3 d\mu \geq &\int_{\mathcal{X}} \tilde{\phi} f_3 d\mu + c_1 \int_{\mathcal{X}} [\phi - \tilde{\phi}]f_1 d\mu \\ &+ c_2 \int_{\mathcal{X}} [\phi - \tilde{\phi}]f_2 d\mu \end{aligned} \tag{1} \]

我们将后两项的和称为「余项」,分两种情形讨论余项的符号。

情形1:等式约束\(\phi, \tilde{\phi} \in \Phi'_\alpha\)

此时\(\int \phi f_i d\mu = \int \tilde{\phi} f_i d\mu = \alpha_i\),因此\(\int [\phi - \tilde{\phi}]f_i d\mu = 0\),余项为0,代入(1)式直接得到:

\[\int \phi f_3 d\mu \geq \int \tilde{\phi} f_3 d\mu \]

结论(1)得证。

情形2:不等式约束\(\phi \in \Phi'_\alpha, \tilde{\phi} \in \Phi_\alpha\),且\(c_1\geq0,c_2\geq0\)

此时\(\int \phi f_i d\mu = \alpha_i\)\(\int \tilde{\phi} f_i d\mu \leq \alpha_i\),因此\(\int [\phi - \tilde{\phi}]f_i d\mu \geq 0\)
结合\(c_1\geq0,c_2\geq0\),余项\(\geq0\),代入(1)式仍可得到:

\[\int \phi f_3 d\mu \geq \int \tilde{\phi} f_3 d\mu \]

结论(2)得证。

唯一性证明

\(\tilde{\phi}\)也达到最大功效,则必须有\(A(x)=0\)几乎处处成立。在\(R^+ \cup R^-\)上,\(f_3 - c_1f_1 - c_2f_2 \neq 0\),因此必须有\(\phi(x)=\tilde{\phi}(x)\)几乎处处成立,即\(\phi(x)\)\(R^+ \cup R^-\)上唯一。

1.4 特例验证

\(f_1(x)\)不存在时,检验退化为单点原假设的经典N-P问题,此时\(R^+ = \{x:f_3(x)>c_2f_2(x)\}\),与经典N-P引理的检验形式完全一致,验证了推广的合理性。

二、引理6.4.1:指数族下检验(i)'的MPT构造与推导

2.1 检验问题的设定

考虑单参数指数族分布:

\[f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}, \quad \theta\in\mathbb{R} \]

其中\(Q(\theta)\)\(\theta\)的严格增函数,\(T(x)\)\(\theta\)的充分统计量。

我们研究简单假设检验问题:

\[(i)' \quad H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta=\theta_3, \quad \theta_1<\theta_3<\theta_2 \]

目标是找到满足\(E_{\theta_1}[\phi(X)]\leq\alpha\)\(E_{\theta_2}[\phi(X)]\leq\alpha\)的检验中,最大化\(E_{\theta_3}[\phi(X)]\)的MPT。

2.2 拒绝域的化简

对应推广的N-P引理,\(f_1=f(x,\theta_1),f_2=f(x,\theta_2),f_3=f(x,\theta_3)\),拒绝域为:

\[R^+ = \{x: f(x,\theta_3) > c_1f(x,\theta_1) + c_2f(x,\theta_2)\} \]

将指数族密度代入,两边除以\(h(x)a(\theta_3)e^{Q(\theta_3)T(x)}\)(恒正,不改变不等式方向),令:

\[d_1 = c_1 \cdot \frac{a(\theta_1)}{a(\theta_3)}, \quad d_2 = c_2 \cdot \frac{a(\theta_2)}{a(\theta_3)} \]

\[-b_1 = Q(\theta_1)-Q(\theta_3), \quad b_2 = Q(\theta_2)-Q(\theta_3) \]

\(\theta_1<\theta_3<\theta_2\)\(Q(\theta)\)严格递增,得\(b_1>0,b_2>0\)。此时拒绝域等价于:

\[R^+ = \{x: g(T(x)) < 1\}, \quad g(t) = d_1e^{-b_1t} + d_2e^{b_2t} \]

2.3 \(g(t)\)的性质分析与拒绝域形式确定

我们通过分析\(g(t)\)的符号、单调性、凹凸性,确定拒绝域的形式,核心是排除不符合约束的情形。

情形1:\(d_1\leq0\)\(d_2\leq0\)

此时\(g(t)\leq0<1\)对所有\(t\)成立,\(R^+=\mathcal{X}\),即\(\phi(x)\equiv1\),此时\(E_{\theta_1}[\phi]=E_{\theta_2}[\phi]=1\),与\(0<\alpha<1\)矛盾,排除。

情形2:\(d_1>0,d_2<0\)\(d_1<0,d_2>0\)对称)

\(g(t)\)求一阶导数:

\[g'(t) = -b_1d_1e^{-b_1t} + b_2d_2e^{b_2t} \]

两项均恒负,因此\(g'(t)<0\)\(g(t)\)是严格减函数,\(g(t)<1\)的解为\(t>k\)(单边拒绝域)。

而单边检验的功效函数是\(\theta\)的严格增函数,必有\(\beta(\theta_1)<\beta(\theta_2)\),无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\)的约束,排除。

唯一可行情形:\(d_1\geq0,d_2\geq0\)且不全为0

\(g(t)\)求二阶导数:

\[g''(t) = b_1^2d_1e^{-b_1t} + b_2^2d_2e^{b_2t} \]

所有项均非负且不全为0,因此\(g''(t)>0\)\(g(t)\)严格凸函数(开口向上的U型曲线)。

严格凸函数\(g(t)=1\)最多有两个解\(k_1<k_2\),且:

  • \(k_1<t<k_2\)时,\(g(t)<1\)
  • \(t<k_1\)\(t>k_2\)时,\(g(t)>1\)

因此拒绝域为:

\[R^+ = \{x: k_1 < T(x) < k_2\} \]

2.4 检验函数的最终形式与最优性

结合拒绝域与随机化检验的要求,检验函数为:

\[\phi_1(x) = \begin{cases} 1, & k_1 < T(x) < k_2 \\ \gamma_{1i}, & T(x)=k_i, \ i=1,2 \\ 0, & T(x)<k_1 \text{ 或 } T(x)>k_2 \end{cases} \]

其中\(k_1,k_2,\gamma_{11},\gamma_{12}\)由约束\(E_{\theta_1}[\phi_1(X)]=\alpha\)\(E_{\theta_2}[\phi_1(X)]=\alpha\)唯一确定。

最优性证明
\(d_1\geq0,d_2\geq0\)\(c_1\geq0,c_2\geq0\),根据推广的N-P引理结论(2),对任意满足\(E_{\theta_1}[\tilde{\phi}]\leq\alpha\)\(E_{\theta_2}[\tilde{\phi}]\leq\alpha\)的检验\(\tilde{\phi}\),都有\(E_{\theta_3}[\phi_1(X)]\geq E_{\theta_3}[\tilde{\phi}(X)]\),即\(\phi_1(x)\)是检验(i)'的MPT。

2.5 关键推论

上述检验\(\phi_1(x)\)的形式与备择假设的\(\theta_3\)无关,仅由\(\theta_1,\theta_2\)\(\alpha\)决定。因此\(\phi_1(x)\)不仅是单点备择假设的MPT,更是对整个备择空间\(\theta_1<\theta<\theta_2\)的一致最优检验,即:

\(\phi_1(x)\)是检验问题 \((i)'' \ H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\) 的UMPT。

三、检验(i)的全局UMPT证明

检验(i)的完整形式为:

\[(i) \quad H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2 \]

我们证明上述\(\phi_1(x)\)是该问题的全局UMPT,需验证两个核心条件:

3.1 水平有效性:原假设空间上满足\(E_\theta[\phi_1(X)]\leq\alpha\)

指数族的功效函数\(\beta(\theta)=E_\theta[\phi_1(X)]\)是关于\(\theta\)的连续可导函数,且为先增后减的单峰函数(凹函数),在区间\((\theta_1,\theta_2)\)内取得最大值。
因此:

  • \(\theta\leq\theta_1\)时,\(\beta(\theta)\leq\beta(\theta_1)=\alpha\)
  • \(\theta\geq\theta_2\)时,\(\beta(\theta)\leq\beta(\theta_2)=\alpha\)

对所有\(\theta\in\Theta_0\),都有\(\beta(\theta)\leq\alpha\),满足水平为\(\alpha\)的要求。

3.2 一致最优性:备择假设空间上功效一致最高

对任意水平为\(\alpha\)的检验\(\tilde{\phi}\),必然满足\(E_{\theta_1}[\tilde{\phi}]\leq\alpha\)\(E_{\theta_2}[\tilde{\phi}]\leq\alpha\)。根据引理6.4.1,对所有\(\theta_1<\theta<\theta_2\),都有\(E_\theta[\phi_1(X)]\geq E_\theta[\tilde{\phi}(X)]\)

综上,\(\phi_1(x)\)是双边检验(i)的全局UMPT,这是三类双边检验中唯一存在全局UMPT的情形。

四、核心知识点总结表格

检验问题 原假设\(H_0\) 备择假设\(H_1\) 最优检验类型 检验函数形式(基于充分统计量\(T(x)\) 约束条件 核心性质
检验(i)' \(\theta=\theta_1\)\(\theta=\theta_2\) \(\theta=\theta_3\)\(\theta_1<\theta_3<\theta_2\) MPT $$\phi(x)=\begin{cases}1, & k_1<T(x)<k_2 \ \gamma_i, & T(x)=k_i \ 0, & \text{其他}\end{cases}$$ \(E_{\theta_1}[\phi]=\alpha\)
\(E_{\theta_2}[\phi]=\alpha\)
检验形式与\(\theta_3\)无关,由推广的N-P引理保证最优性
检验(i) \(\theta\leq\theta_1\)\(\theta\geq\theta_2\) \(\theta_1<\theta<\theta_2\) 全局UMPT 同上 同上 功效函数为单峰凹函数,原假设空间上\(\beta(\theta)\leq\alpha\),备择空间上功效一致最优
检验(ii) \(\theta_1\leq\theta\leq\theta_2\) \(\theta<\theta_1\)\(\theta>\theta_2\) UMPUT(无全局UMPT) $$\phi(x)=\begin{cases}1, & T(x)<k_1 \text{ 或 } T(x)>k_2 \ \gamma_i, & T(x)=k_i \ 0, & \text{其他}\end{cases}$$ \(E_{\theta_1}[\phi]=\alpha\)
\(E_{\theta_2}[\phi]=\alpha\)
功效函数为凸函数,仅在无偏检验类中一致最优
检验(iii) \(\theta=\theta_0\) \(\theta\neq\theta_0\) UMPUT(无全局UMPT) 同上 \(E_{\theta_0}[\phi]=\alpha\)
\(\beta'(\theta_0)=0\)
功效函数为凸函数,\(\theta_0\)为极小值点,仅在无偏检验类中一致最优

五、核心结论

  1. 推广的N-P引理是解决多约束假设检验问题的核心工具,是经典N-P引理在多约束场景下的直接推广;
  2. 单参数指数族的三类双边检验中,仅检验(i)存在全局UMPT,检验(ii)和(iii)不存在全局UMPT,仅能在无偏检验类中找到UMPUT;
  3. 所有最优检验均基于参数的充分统计量\(T(x)\)构造,临界值由无偏性的边界约束条件唯一确定,这是指数族分布充分性原则的直接体现。

引理6.4.2 完整讲解、严格证明与核心应用

承接上一讲的内容,我们已经通过推广的N-P引理得到了检验(i)''(\(H_0:\theta=\theta_1\)\(\theta=\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\))的UMPT\(\phi_1(x)\),但要完成检验(i)全局UMPT的完整证明,还需验证\(\phi_1(x)\)在原假设全空间\(\theta\leq\theta_1\)\(\theta\geq\theta_2\)上满足水平约束\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\);同时,后续求解检验(ii)的一致最优无偏检验(UMPUT),也需要一个针对「双边拒绝域检验」的最优性引理。本讲将完整讲解引理6.4.2的内容、严格证明、与引理6.4.1的本质差异,以及其两大核心应用。


一、引理6.4.2的正式表述与背景

1.1 适用分布与检验问题

针对单参数指数族分布:

\[f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}, \quad \theta\in\mathbb{R} \]

其中\(Q(\theta)\)\(\theta\)的严格增函数,\(T(x)\)\(\theta\)的充分统计量。

考虑简单假设检验问题:

\[(ii)' \quad H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta=\theta_4 \ (\theta_4<\theta_1) \text{ 或 } \theta=\theta_5 \ (\theta_5>\theta_2) \]

1.2 检验函数形式

若检验函数\(\phi_2(x)\)具有双边拒绝域的形式:

\[\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ \gamma_{2i}, & T(x)=k_i \ (i=1,2) \\ 0, & k_1 < T(x) < k_2 \end{cases} \]

其中\(k_1<k_2\)为临界值,\(\gamma_{21},\gamma_{22}\)为随机化参数。

1.3 约束条件与核心结论

若存在\(k_i,\gamma_{2i}\)使得\(\phi_2(x)\)满足等式约束:

\[\mathbb{E}_{\theta_1}[\phi_2(X)] = \alpha, \quad \mathbb{E}_{\theta_2}[\phi_2(X)] = \alpha \quad (0<\alpha<1) \]

\(\phi_2(x)\in\Phi'_\alpha\),则对所有满足相同等式约束的检验\(\tilde{\phi}(x)\in\Phi'_\alpha\),有:

\[\mathbb{E}_{\theta_4}[\phi_2(X)] \geq \mathbb{E}_{\theta_4}[\tilde{\phi}(X)], \quad \forall \theta_4<\theta_1 \]

\[\mathbb{E}_{\theta_5}[\phi_2(X)] \geq \mathbb{E}_{\theta_5}[\tilde{\phi}(X)], \quad \forall \theta_5>\theta_2 \]

\(\phi_2(x)\)\(R^+\cup R^-\)上几乎处处唯一。


二、引理6.4.2的严格证明

我们仅证明\(H_1:\theta=\theta_4 \ (\theta_4<\theta_1)\)的情形,\(H_1:\theta=\theta_5 \ (\theta_5>\theta_2)\)的证明完全对称。

步骤1:基于推广的N-P引理构造拒绝域

对应推广的N-P引理,令:

  • 原假设两点的密度:\(f_1(x)=f(x,\theta_1), \ f_2(x)=f(x,\theta_2)\)
  • 备择假设的密度:\(f_3(x)=f(x,\theta_4)\)

根据推广的N-P引理,最大化\(\mathbb{E}_{\theta_4}[\phi(X)]\)的检验,其拒绝域为:

\[R^+ = \{x: f(x,\theta_4) > c_1f(x,\theta_1) + c_2f(x,\theta_2)\} \]

将指数族密度代入,两边除以恒正的\(h(x)\),得:

\[R^+ = \left\{x: a(\theta_4)e^{Q(\theta_4)T(x)} > c_1a(\theta_1)e^{Q(\theta_1)T(x)} + c_2a(\theta_2)e^{Q(\theta_2)T(x)}\right\} \]

\(\theta_4<\theta_1<\theta_2\)\(Q(\theta)\)严格递增,得\(Q(\theta_4)<Q(\theta_1)<Q(\theta_2)\),这是后续分析的核心前提。

步骤2:排除不符合约束的参数情形

我们的目标是找到\(c_1,c_2\),使得检验满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),因此需要逐一排除不可能的\(c_1,c_2\)符号组合。

情形1:\(c_1\leq0\)\(c_2\leq0\)

此时不等式右边\(c_1f_1 + c_2f_2 \leq 0\),而左边\(f(x,\theta_4)>0\),因此\(R^+=\mathcal{X}\)(全样本空间),即\(\phi_2(x)\equiv1\)
此时\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=1\),与\(0<\alpha<1\)的前提矛盾,排除。

情形2:\(c_1\leq0\)\(c_2>0\)

将拒绝域不等式两边除以\(c_2a(\theta_2)e^{Q(\theta_2)T(x)}\)(恒正,不改变不等号方向),整理得:

\[R^+ = \left\{x: T(x)=t, \ g(t) = d_1e^{-b_1t} + d_2e^{-b_2t} > 1\right\} \]

其中:

\[d_1 = \frac{a(\theta_4)}{c_2a(\theta_2)} > 0, \quad d_2 = -\frac{c_1a(\theta_1)}{c_2a(\theta_2)} \geq 0 \]

\[-b_1 = Q(\theta_4)-Q(\theta_2) < 0, \quad -b_2 = Q(\theta_1)-Q(\theta_2) < 0 \implies b_1,b_2>0 \]

\(g(t)\)求一阶导数:

\[g'(t) = -b_1d_1e^{-b_1t} - b_2d_2e^{-b_2t} < 0 \]

\(g(t)\)是关于\(t\)严格减函数,因此\(g(t)>1\)的解为\(T(x)<k\)(单边左拒绝域)。

根据单调似然比分布族的性质,单边左拒绝域对应的检验,其功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)\(\theta\)严格减函数,因此必有\(\beta(\theta_1) > \beta(\theta_2)\),无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\)的约束,排除。

情形3:唯一可行情形\(c_1>0\),进一步分析\(c_2\)的符号

由前两种情形的排除,必然有\(c_1>0\)。将拒绝域不等式两边除以\(c_1a(\theta_1)e^{Q(\theta_1)T(x)}\)(恒正),整理得:

\[R^+ = \left\{x: T(x)=t, \ g(t) = d_1e^{-b_1t} + d_2e^{b_2t} > 1\right\} \]

其中:

\[d_1 = \frac{a(\theta_4)}{c_1a(\theta_1)} > 0, \quad d_2 = -\frac{c_2a(\theta_2)}{c_1a(\theta_1)} \]

\[-b_1 = Q(\theta_4)-Q(\theta_1) < 0, \quad b_2 = Q(\theta_2)-Q(\theta_1) > 0 \implies b_1,b_2>0 \]

我们继续分析\(d_2\)的符号(即\(c_2\)的符号):

  • \(d_2\leq0\)(即\(c_2\geq0\)),对\(g(t)\)求一阶导数:

    \[g'(t) = -b_1d_1e^{-b_1t} + b_2d_2e^{b_2t} < 0 \]

    \(g(t)\)仍为严格减函数,拒绝域为单边左拒绝域,与情形2一致,无法满足\(\beta(\theta_1)=\beta(\theta_2)=\alpha\),排除。

  • 因此必然有\(d_2>0\)(即\(c_2<0\),此时对\(g(t)\)求二阶导数:

    \[g''(t) = b_1^2d_1e^{-b_1t} + b_2^2d_2e^{b_2t} > 0 \]

    \(g(t)\)是关于\(t\)严格凸函数(开口向上的U型曲线)。

步骤3:确定拒绝域的最终形式

严格凸函数\(g(t)=1\)最多有两个解\(k_1<k_2\),且:

  • \(t<k_1\)\(t>k_2\)时,\(g(t)>1\),对应拒绝域;
  • \(k_1<t<k_2\)时,\(g(t)<1\),对应接受域。

因此拒绝域为:

\[R^+ = \{x: T(x)<k_1 \text{ 或 } T(x)>k_2\} \]

与引理中\(\phi_2(x)\)的形式完全一致。

步骤4:最优性与唯一性证明

由上述推导,\(\phi_2(x)\)满足推广的N-P引理的检验形式,且约束为等式\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),符合推广的N-P引理的结论(1)。

因此对所有满足相同等式约束的\(\tilde{\phi}(x)\in\Phi'_\alpha\),必有\(\mathbb{E}_{\theta_4}[\phi_2(X)] \geq \mathbb{E}_{\theta_4}[\tilde{\phi}(X)]\)

唯一性证明与经典N-P引理一致:若\(\tilde{\phi}\)也达到最大功效,则必须在\(R^+\cup R^-\)上满足\(\tilde{\phi}(x)=\phi_2(x)\)几乎处处成立,因此\(\phi_2(x)\)\(R^+\cup R^-\)上唯一。


三、引理6.4.2与引理6.4.1的核心差异

这两个引理是指数族双边检验的两大核心工具,但存在本质区别,我们通过表格清晰对比:

对比维度 引理6.4.1 引理6.4.2
检验问题 \(H_0:\theta=\theta_1/\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\)(中间备择) \(H_0:\theta=\theta_1/\theta_2 \leftrightarrow H_1:\theta<\theta_1\)\(\theta>\theta_2\)(两侧备择)
检验形式 中间拒绝域(\(k_1<T<k_2\)时拒绝) 双边拒绝域(\(T<k_1\)\(T>k_2\)时拒绝)
拉格朗日常数符号 \(c_1\geq0, c_2\geq0\) \(c_1>0, c_2<0\)
适用的检验类 不等式约束检验类\(\Phi_\alpha\)\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\) 仅等式约束检验类\(\Phi'_\alpha\)\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)
最优性性质 全局最优势检验(MPT) 仅等式约束下的最优检验,非全局MPT
核心应用 证明检验(i)的全局UMPT 证明检验(ii)的UMPUT,补全检验(i)的水平有效性

关键差异的本质原因

推广的N-P引理的结论(2)(对不等式约束的检验类最优),要求\(c_1,c_2\)均非负;而引理6.4.2中\(c_2<0\),不满足该条件,因此仅能对等式约束的检验类成立。

但这一限制恰好适配无偏检验的要求:根据无偏检验的边界性质,任何水平为\(\alpha\)的无偏检验,都必须满足\(\mathbb{E}_{\theta_1}[\phi(X)]=\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),因此引理6.4.2是求解UMPUT的核心工具。


四、引理6.4.2的两大核心应用

应用1:补全检验(i)全局UMPT的证明

检验(i)的完整形式为:

\[(i) \quad H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2 \]

我们已经证明\(\phi_1(x)\)是检验(i)''的UMPT,现在需要证明\(\phi_1(x)\)是水平为\(\alpha\)的检验,即对所有\(\theta\leq\theta_1\)\(\theta\geq\theta_2\),有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\)

证明逻辑:

  1. 取任意\(\theta_4<\theta_1\),考虑检验\(\tilde{\phi}(x)\equiv\alpha\),显然满足\(\mathbb{E}_{\theta_1}[\tilde{\phi}]=\mathbb{E}_{\theta_2}[\tilde{\phi}]=\alpha\),属于等式约束检验类\(\Phi'_\alpha\)
  2. 引理6.4.2的对称情形(中间拒绝域的最优性)告诉我们,\(\phi_1(x)\)\(\theta_4<\theta_1\)时的功效\(\beta_{\phi_1}(\theta_4)\),是所有满足等式约束的检验中最小的,因此\(\beta_{\phi_1}(\theta_4) \leq \beta_{\tilde{\phi}}(\theta_4)=\alpha\)
  3. 同理,对任意\(\theta_5>\theta_2\),有\(\beta_{\phi_1}(\theta_5) \leq \alpha\)

因此\(\phi_1(x)\)在原假设全空间上满足\(\beta(\theta)\leq\alpha\),是水平为\(\alpha\)的检验。结合其在备择空间上的一致最优性,\(\phi_1(x)\)是检验(i)的全局UMPT,完成了完整证明。

应用2:为检验(ii)的UMPUT提供核心支撑

检验(ii)的完整形式为:

\[(ii) \quad H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

该问题不存在全局UMPT,我们需要在无偏检验类中寻找UMPUT。根据无偏检验的定义,所有无偏检验都必须满足边界条件\(\mathbb{E}_{\theta_1}[\phi(X)]=\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),恰好属于引理6.4.2的等式约束检验类\(\Phi'_\alpha\)

引理6.4.2直接证明了:\(\phi_2(x)\)在所有无偏检验中,对任意\(\theta<\theta_1\)\(\theta>\theta_2\),功效都达到最大,因此\(\phi_2(x)\)就是检验(ii)的一致最优无偏检验(UMPUT)


五、核心结论总结

  1. 引理6.4.2是推广的N-P引理在「双边拒绝域检验」中的具体应用,解决了两侧备择假设下,等式约束检验类的最优性问题;
  2. 该引理的核心限制是仅对等式约束的检验类成立,本质是拉格朗日常数\(c_2<0\),不满足非负条件,因此无法得到全局MPT,但完美适配无偏检验的边界约束;
  3. 该引理是连接「简单假设检验」与「复合假设双边检验」的关键桥梁,既补全了检验(i)全局UMPT的证明,也为检验(ii)和(iii)的UMPUT提供了核心理论支撑。

推论1与推论2 详细讲解、证明拆解与核心意义

承接之前的引理6.4.1与6.4.2,我们将完整拆解这两个推论的证明逻辑、核心结论与统计意义,完整衔接复合假设双边检验的理论链条。


前置知识回顾

为保证逻辑连贯,先明确核心前置概念:

  1. 单参数指数族\(f(x,\theta)=a(\theta)h(x)e^{Q(\theta)T(x)}\),其中\(Q(\theta)\)\(\theta\)的严格增函数,\(T(x)\)\(\theta\)的充分统计量,功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)关于\(\theta\)连续。
  2. 检验问题(ii)''\(H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
  3. UMPUT(一致最优无偏检验):需满足两个核心条件
    • 无偏性:原假设上\(\mathbb{E}_\theta[\phi(X)]\leq\alpha\),备择假设上\(\mathbb{E}_\theta[\phi(X)]\geq\alpha\)
    • 一致最优性:在所有水平为\(\alpha\)的无偏检验中,对任意备择\(\theta\),功效\(\mathbb{E}_\theta[\phi(X)]\)达到最大。
  4. 引理6.4.2核心结论:双边拒绝域检验\(\phi_2(x)\)\(T<k_1\)\(T>k_2\)时拒绝),在等式约束检验类\(\Phi'_\alpha=\{\phi:\mathbb{E}_{\theta_1}[\phi]=\mathbb{E}_{\theta_2}[\phi]=\alpha\}\)中,对任意单点备择\(\theta<\theta_1\)\(\theta>\theta_2\)是最优的,且检验形式与备择\(\theta\)无关。

一、推论1 详细讲解与完整证明

1. 推论1正式表述

\(\phi_2(x)\)是以下假设检验问题的一致最优无偏检验(UMPUT):

\[(ii)'' \quad H_0:\theta=\theta_1 \text{ 或 } \theta=\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

其中\(\phi_2(x)\)为双边拒绝域检验:

\[\phi_2(x) = \begin{cases} 1, & T(x)<k_1 \text{ 或 } T(x)>k_2 \\ \gamma_{2i}, & T(x)=k_i \ (i=1,2) \\ 0, & k_1<T(x)<k_2 \end{cases} \]

且满足约束\(\mathbb{E}_{\theta_1}[\phi_2(X)]=\mathbb{E}_{\theta_2}[\phi_2(X)]=\alpha\)

2. 证明分步拆解

证明分为三大核心步骤,完整覆盖「一致最优性→无偏性→无偏检验类范围」的完整逻辑链。

步骤1:证明\(\phi_2(x)\)在整个备择空间的一致最优性

引理6.4.2仅证明了\(\phi_2(x)\)单点备择\(\theta=\theta_4<\theta_1\)\(\theta=\theta_5>\theta_2\)的最优性,而推论1需要推广到整个备择空间

关键性质:\(\phi_2(x)\)的临界值\(k_1,k_2\)、随机化参数\(\gamma_{2i}\),仅由\(\theta_1,\theta_2\)和显著性水平\(\alpha\)决定,与备择假设的具体取值\(\theta_4,\theta_5\)完全无关

因此引理6.4.2的最优性结论,对所有\(\theta<\theta_1\)\(\theta>\theta_2\)都成立,即对任意\(\tilde{\phi}\in\Phi'_\alpha\),有:

\[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)], \quad \forall \theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

这就证明了\(\phi_2(x)\)\(\Phi'_\alpha\)类中,对整个备择空间是一致最优的。

步骤2:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验

无偏检验的两个要求,我们逐一验证:

  1. 原假设约束\(\phi_2(x)\)满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\),自然满足原假设上\(\mathbb{E}_\theta[\phi_2]\leq\alpha\)的水平要求。
  2. 备择假设约束:取基准检验\(\phi^*(x)\equiv\alpha\)(恒等于\(\alpha\)的随机化检验),显然\(\mathbb{E}_{\theta_1}[\phi^*]=\mathbb{E}_{\theta_2}[\phi^*]=\alpha\),即\(\phi^*\in\Phi'_\alpha\)

根据步骤1的最优性结论,对任意备择\(\theta\),有:

\[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\phi^*(X)] = \alpha \]

完美满足无偏检验在备择假设上的要求。

综上,\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验。

步骤3:证明所有无偏检验都属于\(\Phi'_\alpha\),完成UMPUT证明

\(\tilde{\phi}(x)\)是检验(ii)''的任意一个水平为\(\alpha\)的无偏检验,我们证明它必然属于\(\Phi'_\alpha\)

根据无偏性定义:

  • 原假设上:\(\mathbb{E}_{\theta_1}[\tilde{\phi}]\leq\alpha\)\(\mathbb{E}_{\theta_2}[\tilde{\phi}]\leq\alpha\)
  • 备择假设上:\(\mathbb{E}_\theta[\tilde{\phi}]\geq\alpha\),对所有\(\theta<\theta_1\)\(\theta>\theta_2\)

指数族的功效函数\(\beta(\theta)=\mathbb{E}_\theta[\tilde{\phi}(X)]\)是关于\(\theta\)的连续函数,取\(\theta\to\theta_1^-\)(从左侧趋近\(\theta_1\)),由连续性得:

\[\lim_{\theta\to\theta_1^-} \beta(\theta) = \beta(\theta_1) = \mathbb{E}_{\theta_1}[\tilde{\phi}] \]

无偏性要求\(\lim_{\theta\to\theta_1^-} \beta(\theta)\geq\alpha\),原假设要求\(\beta(\theta_1)\leq\alpha\),因此只能取等号:\(\mathbb{E}_{\theta_1}[\tilde{\phi}]=\alpha\)

同理,取\(\theta\to\theta_2^+\),可得\(\mathbb{E}_{\theta_2}[\tilde{\phi}]=\alpha\)

这就证明了:检验(ii)''的所有水平为\(\alpha\)的无偏检验,都属于等式约束检验类\(\Phi'_\alpha\)

结合步骤1的结论:\(\phi_2(x)\)\(\Phi'_\alpha\)中是一致最优的,因此\(\phi_2(x)\)在所有无偏检验中一致最优,即\(\phi_2(x)\)是检验(ii)''的水平为\(\alpha\)的UMPUT。

3. 推论1的核心意义

  1. 把引理6.4.2的「单点备择最优检验」推广到「复合备择的一致最优无偏检验」,解决了两点原假设检验(ii)''的UMPUT存在性与构造问题;
  2. 明确了无偏检验类的范围:所有无偏检验必须满足原假设两点的功效严格等于\(\alpha\),为后续复合原假设检验(ii)的UMPUT证明奠定了核心基础。

二、推论2 详细讲解与完整证明

1. 推论2正式表述

\(\phi_2'(x) = 1 - \phi_1(x)\),其中\(\phi_1(x)\)是引理6.4.1中检验(i)''的UMPT(中间拒绝域检验):

\[\phi_1(x) = \begin{cases} 1, & k_1<T(x)<k_2 \\ \gamma_{1i}, & T(x)=k_i \ (i=1,2) \\ 0, & T(x)<k_1 \text{ 或 } T(x)>k_2 \end{cases} \]

且满足\(\mathbb{E}_{\theta_1}[\phi_1(X)]=\mathbb{E}_{\theta_2}[\phi_1(X)]=\alpha\)

\(\phi_2'(x)\)是检验(ii)''的水平为\(1-\alpha\)的UMPUT。

2. 证明分步拆解

证明核心是利用检验的对偶性,结合推论1与引理的唯一性结论完成。

步骤1:推导\(\phi_2'(x)\)的具体形式

\(\phi_2'(x)=1-\phi_1(x)\),直接代入\(\phi_1(x)\)的形式,分情况计算:

  • \(T(x)<k_1\)\(T(x)>k_2\)时,\(\phi_1(x)=0\),因此\(\phi_2'(x)=1\)
  • \(T(x)=k_i\)时,\(\phi_1(x)=\gamma_{1i}\),因此\(\phi_2'(x)=1-\gamma_{1i}\)
  • \(k_1<T(x)<k_2\)时,\(\phi_1(x)=1\),因此\(\phi_2'(x)=0\)

最终\(\phi_2'(x)\)的形式为:

\[\phi_2'(x) = \begin{cases} 1, & T(x)<k_1 \text{ 或 } T(x)>k_2 \\ 1-\gamma_{1i}, & T(x)=k_i \ (i=1,2) \\ 0, & k_1<T(x)<k_2 \end{cases} \]

完全符合引理6.4.2中双边拒绝域检验的标准形式,与推论1中UMPUT的形式一致。

步骤2:验证\(\phi_2'(x)\)的水平为\(1-\alpha\)

由期望的线性性质,对\(i=1,2\)有:

\[\mathbb{E}_{\theta_i}[\phi_2'(X)] = \mathbb{E}_{\theta_i}[1-\phi_1(X)] = 1 - \mathbb{E}_{\theta_i}[\phi_1(X)] \]

\(\phi_1(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_1(X)]=\alpha\),因此:

\[\mathbb{E}_{\theta_i}[\phi_2'(X)] = 1-\alpha, \quad i=1,2 \]

\(\phi_2'(x)\in\Phi'_{1-\alpha}\),满足水平为\(1-\alpha\)的等式约束。

步骤3:结合唯一性与推论1,证明是UMPUT

根据推论1,检验(ii)''的水平为\(1-\alpha\)的UMPUT,必须是满足\(\mathbb{E}_{\theta_1}[\phi]=\mathbb{E}_{\theta_2}[\phi]=1-\alpha\)的双边拒绝域检验;同时根据引理6.4.2,这种检验在\(R^+\cup R^-\)上是几乎处处唯一的。

\(\phi_2'(x)\)恰好满足:

  1. 双边拒绝域的标准形式;
  2. 水平\(1-\alpha\)的等式约束;
  3. 唯一性保证它就是检验(ii)''的水平为\(1-\alpha\)的UMPUT。

3. 推论2的核心意义:检验的对偶性

这个推论揭示了假设检验中非常重要的对偶性质,大幅简化了双边检验的构造:

  1. 拒绝域与接受域的对偶:检验(i)''的UMPT\(\phi_1(x)\),拒绝域是中间区间\(k_1<T<k_2\);其补检验\(1-\phi_1(x)\)的拒绝域正好是两侧区间\(T<k_1\)\(T>k_2\),完美对应检验(ii)''的拒绝域要求。
  2. 检验类型的对偶:中间拒绝域的UMPT,其补检验就是双边拒绝域的UMPUT,仅需调整显著性水平为\(1-\alpha\),无需重复推导临界值。
  3. 计算简化:实际应用中,我们只需要求出检验(i)的临界值,就可以直接得到检验(ii)的临界值,大幅降低计算量。

三、核心结论总结表格

对比维度 推论1 推论2
核心结论 双边拒绝域检验\(\phi_2(x)\)是检验(ii)''的水平为\(\alpha\)的UMPUT 检验(i)''的UMPT\(\phi_1(x)\)的补检验\(1-\phi_1(x)\),是检验(ii)''的水平为\(1-\alpha\)的UMPUT
检验形式 双边拒绝域:\(T<k_1\)\(T>k_2\)时拒绝\(H_0\) 双边拒绝域:\(T<k_1\)\(T>k_2\)时拒绝\(H_0\),与\(\phi_1(x)\)的拒绝域完全相反
约束条件 \(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\) \(\mathbb{E}_{\theta_1}[\phi_2']=\mathbb{E}_{\theta_2}[\phi_2']=1-\alpha\)
核心逻辑 1. 检验形式与备择\(\theta\)无关,推广到复合备择;
2. 所有无偏检验都属于等式约束类\(\Phi'_\alpha\)
3. 引理6.4.2保证一致最优性
1. 补检验符合双边拒绝域的标准形式;
2. 期望线性性保证水平匹配;
3. 唯一性保证其为UMPUT
理论价值 完成两点原假设双边检验的UMPUT构造,为复合原假设检验(ii)奠基 揭示中间拒绝域与双边拒绝域检验的对偶性,打通两类双边检验的理论关联
应用价值 给出双边检验UMPUT的标准构造方法 简化双边检验的计算,无需重复求解临界值

定理6.4.2与6.4.3 完整讲解、证明拆解与核心差异

承接之前的引理与推论,这两个定理是单参数指数族双边检验的核心最终结论,分别解决了两类复合原假设双边检验的最优检验构造问题,明确了全局UMPT与UMPUT的适用场景。


前置知识回顾

  1. 单参数指数族标准形式\(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\),其中\(Q(\theta)\)\(\theta\)的严格增函数,\(T(x)\)\(\theta\)的充分统计量,功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)关于\(\theta\)连续。
  2. 两类核心复合双边检验
    • 检验(i)(带内检验):\(H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2\)
    • 检验(ii)(带外检验):\(H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2\)
  3. 关键检验形式
    • 中间拒绝域检验\(\phi_1(x)\)\(k_1<T(x)<k_2\)时拒绝\(H_0\),满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\)
    • 双边拒绝域检验\(\phi_2(x)\)\(T(x)<k_1\)\(T(x)>k_2\)时拒绝\(H_0\),满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\)
  4. 核心引理结论
    • 引理6.4.1:\(\phi_1(x)\)是两点原假设检验(i)''的UMPT,对所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)的检验,备择上功效最优(基于推广N-P引理结论(2),\(c_1,c_2\geq0\)
    • 引理6.4.2:\(\phi_2(x)\)是两点原假设检验(ii)''的UMPUT,仅对满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)的检验,备择上功效最优(基于推广N-P引理结论(1),\(c_1,c_2\)可负)

一、定理6.4.2 详细讲解与证明拆解

1. 定理正式表述

对于假设检验问题

\[(i) \quad H_0:\theta\leq\theta_1 \text{ 或 } \theta\geq\theta_2 \longleftrightarrow H_1:\theta_1<\theta<\theta_2 \]

若存在\(k_i,\gamma_{1i}(i=1,2)\),使得中间拒绝域检验\(\phi_1(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_1(X)]=\alpha(i=1,2)\),则\(\phi_1(x)\)是检验(i)的一致最优检验(UMPT)

2. 证明分步拆解

证明分为两大核心步骤:第一步证明\(\phi_1(x)\)是水平为\(\alpha\)的检验(原假设上满足第一类错误概率约束);第二步证明\(\phi_1(x)\)在备择假设上是一致最优的。

步骤1:证明\(\phi_1(x)\)是水平为\(\alpha\)的检验

水平为\(\alpha\)的检验要求:对所有\(\theta\in\Theta_0\)(即\(\theta\leq\theta_1\)\(\theta\geq\theta_2\)),有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\)

我们利用检验的对偶性和推论2的结论完成证明:

  1. 由推论2,\(\phi_2'(x)=1-\phi_1(x)\)是检验(ii)''的水平为\(1-\alpha\)的UMPUT,即对所有\(\theta<\theta_1\)\(\theta>\theta_2\)\(\phi_2'(x)\)在所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=1-\alpha\)的检验中功效最优。
  2. 取基准检验\(\tilde{\phi}(x)\equiv1-\alpha\),显然满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=1-\alpha\),因此由最优性有:

    \[\mathbb{E}_\theta[\phi_2'(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] = 1-\alpha, \quad \forall \theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

  3. 代入\(\phi_2'(x)=1-\phi_1(x)\),由期望的线性性质得:

    \[\mathbb{E}_\theta[1-\phi_1(X)] \geq 1-\alpha \]

    移项化简后直接得到:

    \[\mathbb{E}_\theta[\phi_1(X)] \leq \alpha, \quad \forall \theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

  4. 同时,\(\phi_1(x)\)在边界点满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\),因此对所有\(\theta\in\Theta_0\),都有\(\mathbb{E}_\theta[\phi_1(X)]\leq\alpha\),即\(\phi_1(x)\)是水平为\(\alpha\)的检验。

步骤2:证明\(\phi_1(x)\)是一致最优的

一致最优性要求:对任意水平为\(\alpha\)的检验\(\tilde{\phi}(x)\),以及所有\(\theta\in\Theta_1\)\(\theta_1<\theta<\theta_2\)),有\(\mathbb{E}_\theta[\phi_1(X)]\geq\mathbb{E}_\theta[\tilde{\phi}(X)]\)

证明逻辑:

  1. \(\tilde{\phi}(x)\)是检验(i)的任意一个水平为\(\alpha\)的检验,即对所有\(\theta\leq\theta_1\)\(\theta\geq\theta_2\),有\(\mathbb{E}_\theta[\tilde{\phi}(X)]\leq\alpha\)
  2. 特别地,在边界点\(\theta=\theta_1\)\(\theta=\theta_2\)处,必然满足\(\mathbb{E}_{\theta_1}[\tilde{\phi}]\leq\alpha\)\(\mathbb{E}_{\theta_2}[\tilde{\phi}]\leq\alpha\),即\(\tilde{\phi}(x)\)属于引理6.4.1中的不等式约束检验类\(\Phi_\alpha\)
  3. 根据引理6.4.1的推论,\(\phi_1(x)\)是检验(i)''的UMPT,对所有\(\tilde{\phi}\in\Phi_\alpha\),以及任意\(\theta_1<\theta<\theta_2\),都有:

    \[\mathbb{E}_\theta[\phi_1(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] \]

  4. 这就证明了\(\phi_1(x)\)在所有水平为\(\alpha\)的检验中,对备择假设全空间的功效一致最高。

综上,\(\phi_1(x)\)是检验(i)的水平为\(\alpha\)的UMPT。


二、定理6.4.3 详细讲解与证明拆解

1. 定理正式表述

对于假设检验问题

\[(ii) \quad H_0:\theta_1\leq\theta\leq\theta_2 \longleftrightarrow H_1:\theta<\theta_1 \text{ 或 } \theta>\theta_2 \]

若存在\(k_i,\gamma_{2i}(i=1,2)\),使得双边拒绝域检验\(\phi_2(x)\)满足\(\mathbb{E}_{\theta_i}[\phi_2(X)]=\alpha(i=1,2)\),则\(\phi_2(x)\)是检验(ii)的一致最优无偏检验(UMPUT)

2. 证明分步拆解

证明分为两大核心步骤:第一步证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验;第二步证明\(\phi_2(x)\)在所有无偏检验中是一致最优的。

步骤1:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验

无偏检验需要满足两个条件:

  1. 水平约束:对所有\(\theta\in\Theta_0\)\(\theta_1\leq\theta\leq\theta_2\)),\(\mathbb{E}_\theta[\phi_2(X)]\leq\alpha\)
  2. 无偏性:对所有\(\theta\in\Theta_1\)\(\theta<\theta_1\)\(\theta>\theta_2\)),\(\mathbb{E}_\theta[\phi_2(X)]\geq\alpha\)

我们同样利用对偶性和引理6.4.1的结论完成证明:

  1. 构造补检验\(\phi_1'(x)=1-\phi_2(x)\),代入\(\phi_2(x)\)的形式,可得\(\phi_1'(x)\)是中间拒绝域检验:

    \[\phi_1'(x) = \begin{cases} 1, & k_1<T(x)<k_2 \\ 1-\gamma_{2i}, & T(x)=k_i \\ 0, & T(x)<k_1 \text{ 或 } T(x)>k_2 \end{cases} \]

  2. \(\mathbb{E}_{\theta_i}[\phi_2]=\alpha\),得\(\mathbb{E}_{\theta_i}[\phi_1']=1-\alpha(i=1,2)\),符合引理6.4.1的检验形式,因此\(\phi_1'(x)\)是检验(i)''的水平为\(1-\alpha\)的UMPT。
  3. 取基准检验\(\tilde{\phi}(x)\equiv1-\alpha\),由最优性得:对所有\(\theta_1<\theta<\theta_2\),有

    \[\mathbb{E}_\theta[\phi_1'(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] = 1-\alpha \]

  4. 代入\(\phi_1'(x)=1-\phi_2(x)\),化简得:

    \[1-\mathbb{E}_\theta[\phi_2(X)] \geq 1-\alpha \implies \mathbb{E}_\theta[\phi_2(X)] \leq \alpha, \quad \forall \theta_1<\theta<\theta_2 \]

    结合边界点\(\mathbb{E}_{\theta_i}[\phi_2]=\alpha\),对所有\(\theta\in\Theta_0\),都有\(\mathbb{E}_\theta[\phi_2(X)]\leq\alpha\),满足水平约束。
  5. 无偏性验证:根据引理6.4.2的推论1,已经证明对所有\(\theta<\theta_1\)\(\theta>\theta_2\),有\(\mathbb{E}_\theta[\phi_2(X)]\geq\alpha\),满足无偏性要求。

综上,\(\phi_2(x)\)是检验(ii)的水平为\(\alpha\)的无偏检验。

步骤2:证明\(\phi_2(x)\)是一致最优无偏检验

一致最优无偏性要求:对任意水平为\(\alpha\)的无偏检验\(\tilde{\phi}(x)\),以及所有\(\theta\in\Theta_1\),有\(\mathbb{E}_\theta[\phi_2(X)]\geq\mathbb{E}_\theta[\tilde{\phi}(X)]\)

证明逻辑:

  1. \(\tilde{\phi}(x)\)是检验(ii)的任意一个水平为\(\alpha\)的无偏检验,根据无偏检验的边界性质,指数族的功效函数连续,因此必然满足:

    \[\mathbb{E}_{\theta_1}[\tilde{\phi}(X)] = \alpha, \quad \mathbb{E}_{\theta_2}[\tilde{\phi}(X)] = \alpha \]

    \(\tilde{\phi}(x)\)属于等式约束检验类\(\Phi'_\alpha\)
  2. 根据引理6.4.2的推论1,\(\phi_2(x)\)是检验(ii)''的UMPUT,对所有\(\tilde{\phi}\in\Phi'_\alpha\),以及任意\(\theta<\theta_1\)\(\theta>\theta_2\),都有:

    \[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] \]

  3. 这就证明了\(\phi_2(x)\)在所有水平为\(\alpha\)的无偏检验中,对备择假设全空间的功效一致最高。

综上,\(\phi_2(x)\)是检验(ii)的水平为\(\alpha\)的UMPUT。


三、两个定理的核心差异与本质原因

1. 核心差异对比表

对比维度 定理6.4.2(检验(i)) 定理6.4.3(检验(ii))
检验问题 \(H_0:\theta\leq\theta_1/\theta\geq\theta_2 \leftrightarrow H_1:\theta_1<\theta<\theta_2\) \(H_0:\theta_1\leq\theta\leq\theta_2 \leftrightarrow H_1:\theta<\theta_1/\theta>\theta_2\)
检验形式 中间拒绝域:\(k_1<T<k_2\)时拒绝\(H_0\) 双边拒绝域:\(T<k_1\)\(T>k_2\)时拒绝\(H_0\)
最优检验类型 全局一致最优检验(UMPT) 一致最优无偏检验(UMPUT)
适用检验类 所有水平为\(\alpha\)的检验(不等式约束\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\) 仅水平为\(\alpha\)的无偏检验(等式约束\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)
理论依据 推广N-P引理结论(2)(要求\(c_1\geq0,c_2\geq0\) 推广N-P引理结论(1)(不要求\(c_1,c_2\)非负)
最优性范围 全检验类中一致最优 仅无偏检验类中一致最优,无全局UMPT

2. 本质原因

两个定理的最优性差异,根源是推广的Neyman-Pearson引理两个结论的适用条件不同

  1. 定理6.4.2对应的\(\phi_1(x)\),其构造用到的拉格朗日常数\(c_1,c_2\)均非负,满足推广N-P引理结论(2)的条件,因此最优性可以覆盖所有满足不等式约束的水平为\(\alpha\)的检验,得到全局UMPT。
  2. 定理6.4.3对应的\(\phi_2(x)\),其构造用到的拉格朗日常数\(c_2<0\),不满足结论(2)的非负要求,只能用推广N-P引理的结论(1),最优性仅能覆盖满足等式约束的检验类。而无偏检验恰好都满足等式约束,因此只能得到无偏检验类中的最优检验(UMPUT),不存在全局UMPT。

3. 关键注释解读

定理6.4.2是双边检验章节唯一的全局UMPT,其余所有双边检验(包括检验(ii)、点原假设的双侧检验(iii))都不存在全局UMPT,仅能找到UMPUT。这是双边检验与单边检验最核心的区别之一。


四、最终结论总结

  1. 单参数指数族的两类复合双边检验,都可以通过充分统计量\(T(x)\)构造最优检验,临界值由原假设边界点的功效约束\(\mathbb{E}_{\theta_i}[\phi]=\alpha\)唯一确定。
  2. 带内检验(检验(i))存在全局UMPT,为中间拒绝域检验,在所有水平为\(\alpha\)的检验中功效一致最优。
  3. 带外检验(检验(ii))不存在全局UMPT,仅存在UMPUT,为双边拒绝域检验,在所有无偏检验中功效一致最优。
  4. 两类检验的构造具有对偶性:检验(i)的UMPT的补检验,就是检验(ii)的水平为\(1-\alpha\)的UMPUT,大幅简化了实际应用中的计算与构造。

点原假设双侧检验(iii)与引理6.4.3 完整讲解、推导证明与核心意义

一、检验问题(iii)的背景与核心难点

我们研究的是数理统计中最常用的点原假设双侧检验

\[(iii) \quad H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0 \]

1.1 检验的定位

该检验是区间原假设双边检验(ii)的特例(令\(\theta_1=\theta_2=\theta_0\)),因此其最优检验的形式与检验(ii)一致,为双边拒绝域检验

\[\phi(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ \gamma_i, & T(x)=k_i \ (i=1,2) \\ 0, & k_1 < T(x) < k_2 \end{cases} \]

其中\(T(x)\)是单参数指数族中\(\theta\)的充分统计量。

1.2 核心难点:定解条件不足

  • 对于区间原假设检验(ii),我们通过两个边界条件\(\mathbb{E}_{\theta_1}[\phi(X)]=\alpha\)\(\mathbb{E}_{\theta_2}[\phi(X)]=\alpha\),可以唯一确定两个临界值\(k_1,k_2\)
  • 对于点原假设检验(iii),原假设仅含单点\(\theta_0\),天然只有一个定解条件\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),无法唯一确定两个临界值,必须补充第二个约束条件。

1.3 补充条件的来源:无偏检验的性质

检验(iii)不存在全局UMPT,我们需要在无偏检验类中寻找UMPUT。无偏检验的核心性质是:
功效函数\(\beta(\theta)=\mathbb{E}_\theta[\phi(X)]\)\(\theta_0\)处取得极小值(原假设处功效为\(\alpha\),备择假设处功效≥α),而指数族的功效函数连续可导,因此极小值点满足\(\beta'(\theta_0)=0\),这就是我们需要的第二个定解条件。

引理6.4.3的核心目标,就是推导指数族下功效函数的导数表达式,并给出\(\beta'(\theta_0)=0\)的等价可计算条件。


二、引理6.4.3 完整表述与分步证明

引理6.4.3 正式表述

对于单参数指数族分布\(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\),有以下三个核心结论:

  1. 充分统计量\(T(X)\)的期望可表示为:

    \[\mathbb{E}_\theta[T(X)] = -\frac{a'(\theta)}{a(\theta)Q'(\theta)} \tag{6.4.18} \]

  2. 检验函数\(\phi(x)\)的功效函数\(\beta(\theta)\)的导数为:

    \[\beta'(\theta) = Q'(\theta)\left\{ \mathbb{E}_\theta[\phi(X)T(X)] - \mathbb{E}_\theta[T(X)]\mathbb{E}_\theta[\phi(X)] \right\} \tag{6.4.19} \]

  3. 检验(iii)的任一水平为\(\alpha\)的无偏检验,满足\(\beta'(\theta_0)=0\),其等价条件为:

    \[\mathbb{E}_{\theta_0}[\phi(X)T(X)] = \mathbb{E}_{\theta_0}[\phi(X)]\mathbb{E}_{\theta_0}[T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \tag{6.4.20} \]


分步证明

步骤1:证明充分统计量的期望公式(6.4.18)

指数族的概率密度满足归一性:对任意\(\theta\),密度在全样本空间的积分等于1,即

\[\int_{\mathcal{X}} a(\theta)h(x)e^{Q(\theta)T(x)} d\mu(x) = 1 \tag{*} \]

指数族满足正则条件,积分与求导可交换顺序,因此对(*)式两边关于\(\theta\)求导:

\[\frac{d}{d\theta} \int_{\mathcal{X}} a(\theta)h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{d}{d\theta}1 = 0 \]

根据乘积求导法则展开左边的导数:

\[\int_{\mathcal{X}} \left[ a'(\theta)h(x)e^{Q(\theta)T(x)} + a(\theta)h(x) \cdot Q'(\theta)T(x) e^{Q(\theta)T(x)} \right] d\mu(x) = 0 \]

将积分拆分为两项,并提取公因子:

\[a'(\theta) \int_{\mathcal{X}} h(x)e^{Q(\theta)T(x)} d\mu(x) + a(\theta)Q'(\theta) \int_{\mathcal{X}} T(x) h(x)e^{Q(\theta)T(x)} d\mu(x) = 0 \]

结合密度的定义\(f(x,\theta)=a(\theta)h(x)e^{Q(\theta)T(x)}\),对两项分别变形:

  • 第一项:\(\int_{\mathcal{X}} h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} f(x,\theta) d\mu(x) = \frac{1}{a(\theta)}\)(归一性)
  • 第二项:\(\int_{\mathcal{X}} T(x) h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} T(x)f(x,\theta) d\mu(x) = \frac{\mathbb{E}_\theta[T(X)]}{a(\theta)}\)(期望定义)

将两项代入求导后的等式:

\[a'(\theta) \cdot \frac{1}{a(\theta)} + a(\theta)Q'(\theta) \cdot \frac{\mathbb{E}_\theta[T(X)]}{a(\theta)} = 0 \]

化简后得到:

\[\frac{a'(\theta)}{a(\theta)} + Q'(\theta)\mathbb{E}_\theta[T(X)] = 0 \]

移项整理,最终得到(6.4.18)式:

\[\mathbb{E}_\theta[T(X)] = -\frac{a'(\theta)}{a(\theta)Q'(\theta)} \]


步骤2:证明功效函数的导数公式(6.4.19)

功效函数的定义为:

\[\beta(\theta) = \mathbb{E}_\theta[\phi(X)] = \int_{\mathcal{X}} \phi(x) f(x,\theta) d\mu(x) = \int_{\mathcal{X}} \phi(x) a(\theta)h(x)e^{Q(\theta)T(x)} d\mu(x) \]

同样利用正则条件,交换积分与求导顺序,对\(\theta\)求导:

\[\beta'(\theta) = \int_{\mathcal{X}} \phi(x) \cdot \frac{d}{d\theta}\left[ a(\theta)h(x)e^{Q(\theta)T(x)} \right] d\mu(x) \]

展开导数(与步骤1完全一致),拆分为两项:

\[\beta'(\theta) = a'(\theta)\int_{\mathcal{X}} \phi(x)h(x)e^{Q(\theta)T(x)} d\mu(x) + a(\theta)Q'(\theta)\int_{\mathcal{X}} \phi(x)T(x)h(x)e^{Q(\theta)T(x)} d\mu(x) \]

对两项分别变形,结合密度定义:

  • 第一项:\(\int_{\mathcal{X}} \phi(x)h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \int_{\mathcal{X}} \phi(x)f(x,\theta) d\mu(x) = \frac{\beta(\theta)}{a(\theta)}\)
  • 第二项:\(\int_{\mathcal{X}} \phi(x)T(x)h(x)e^{Q(\theta)T(x)} d\mu(x) = \frac{1}{a(\theta)} \mathbb{E}_\theta[\phi(X)T(X)]\)

代入导数表达式:

\[\beta'(\theta) = a'(\theta) \cdot \frac{\beta(\theta)}{a(\theta)} + a(\theta)Q'(\theta) \cdot \frac{\mathbb{E}_\theta[\phi(X)T(X)]}{a(\theta)} \]

化简后:

\[\beta'(\theta) = \frac{a'(\theta)}{a(\theta)}\beta(\theta) + Q'(\theta)\mathbb{E}_\theta[\phi(X)T(X)] \]

此时将步骤1得到的\(\frac{a'(\theta)}{a(\theta)} = -Q'(\theta)\mathbb{E}_\theta[T(X)]\)代入上式,替换掉\(\frac{a'(\theta)}{a(\theta)}\)

\[\beta'(\theta) = -Q'(\theta)\mathbb{E}_\theta[T(X)] \cdot \beta(\theta) + Q'(\theta)\mathbb{E}_\theta[\phi(X)T(X)] \]

提取公因子\(Q'(\theta)\),最终得到(6.4.19)式:

\[\beta'(\theta) = Q'(\theta)\left\{ \mathbb{E}_\theta[\phi(X)T(X)] - \mathbb{E}_\theta[T(X)]\mathbb{E}_\theta[\phi(X)] \right\} \]

补充理解:该式的统计意义是\(\beta'(\theta) = Q'(\theta) \cdot \text{Cov}_\theta\left( \phi(X), T(X) \right)\),即功效函数的导数与检验函数和充分统计量的协方差成正比,直观反映了参数变化时检验功效的变化速率。


步骤3:证明无偏检验的等价条件(6.4.20)

对于检验(iii)的水平为\(\alpha\)的无偏检验,满足两个核心性质:

  1. 水平条件:原假设为单点\(\theta_0\),因此\(\mathbb{E}_{\theta_0}[\phi(X)] = \beta(\theta_0) = \alpha\)
  2. 无偏性:对所有\(\theta\neq\theta_0\)\(\beta(\theta) \geq \alpha\),即\(\theta_0\)是功效函数\(\beta(\theta)\)的极小值点。

由于指数族的功效函数连续可导,极小值点处的一阶导数必为0,即\(\beta'(\theta_0) = 0\)

\(\beta'(\theta_0)=0\)代入(6.4.19)式:

\[Q'(\theta_0)\left\{ \mathbb{E}_{\theta_0}[\phi(X)T(X)] - \mathbb{E}_{\theta_0}[T(X)]\mathbb{E}_{\theta_0}[\phi(X)] \right\} = 0 \]

由于\(Q(\theta)\)\(\theta\)的严格增函数,因此\(Q'(\theta_0) \neq 0\),要使等式成立,必须满足大括号内的项为0:

\[\mathbb{E}_{\theta_0}[\phi(X)T(X)] - \mathbb{E}_{\theta_0}[T(X)]\mathbb{E}_{\theta_0}[\phi(X)] = 0 \]

结合水平条件\(\mathbb{E}_{\theta_0}[\phi(X)] = \alpha\),代入后直接得到(6.4.20)式:

\[\mathbb{E}_{\theta_0}[\phi(X)T(X)] = \alpha \mathbb{E}_{\theta_0}[T(X)] \]


三、引理6.4.3的核心意义与应用价值

  1. 解决了定解条件不足的核心问题
    该引理为点原假设双侧检验补充了第二个定解条件,结合\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),两个方程可以唯一确定双边检验的两个临界值\(k_1,k_2\)(以及随机化参数),为构造检验(iii)的UMPUT提供了可计算的约束。

  2. 揭示了无偏检验的本质特征
    点原假设双侧检验的无偏检验,不仅要满足原假设处的第一类错误概率为\(\alpha\),还要满足检验函数与充分统计量在原假设下不相关(协方差为0),这是功效函数在原假设处取得极小值的等价条件。

  3. 衔接了区间原假设与点原假设双边检验
    区间原假设检验(ii)用两个边界点的功效约束定解,点原假设检验(iii)用原假设点的功效约束+导数约束定解,本质是检验(ii)在\(\theta_1\to\theta_2=\theta_0\)时的极限情况,该引理完成了两类双边检验的理论衔接。

  4. 为实际应用提供了直接的计算依据
    实际应用中,正态分布的双侧z检验、t检验,二项分布的双侧检验等常用的点原假设双侧检验,其临界值的确定本质上都基于这两个约束条件,该引理为这些经典检验的最优性提供了理论支撑。


定理6.4.4 点原假设双侧检验的UMPUT 完整讲解与严格证明

一、问题回顾与核心思路

1.1 检验问题与核心难点

我们研究的是数理统计中最常用的点原假设双侧检验

\[(iii) \quad H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0 \]

该检验是区间原假设双边检验(ii)的特例(\(\theta_1=\theta_2=\theta_0\)),核心难点在于定解条件不足

  • 区间原假设检验(ii)可通过两个边界条件\(\mathbb{E}_{\theta_1}[\phi]=\alpha\)\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)确定两个临界值;
  • 点原假设仅能提供一个天然约束\(\mathbb{E}_{\theta_0}[\phi(X)]=\alpha\),无法唯一确定双边检验的两个临界值\(k_1,k_2\)

1.2 解决思路:转化为推广N-P引理的双约束问题

根据引理6.4.3,检验(iii)的任一无偏检验必须满足两个条件:

  1. 水平约束:\(\mathbb{E}_{\theta_0}[\phi(X)] = \alpha\)(原假设处第一类错误概率为\(\alpha\));
  2. 无偏性等价约束:\(\mathbb{E}_{\theta_0}[\phi(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)(功效函数在\(\theta_0\)处导数为0,即\(\beta'(\theta_0)=0\))。

这两个等式约束恰好匹配推广的Neyman-Pearson引理的双等式约束条件,因此我们可以通过推广的N-P引理,在满足这两个约束的检验类中,找到备择假设全空间上功效一致最优的检验,即UMPUT。


二、定理6.4.4 正式表述

定义约束检验类

记满足检验(iii)无偏性双约束的检验类为:

\[\widetilde{\Phi}'_\alpha = \left\{ \phi(x): \mathbb{E}_{\theta_0}[\phi(X)] = \alpha \triangleq \alpha_1,\ \mathbb{E}_{\theta_0}[\phi(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \triangleq \alpha_2 \right\} \]

定理核心结论

  1. 一致最优性:若存在\(k_i,\gamma_{2i}(i=1,2)\),使得双边拒绝域检验

    \[\phi_2(x) = \begin{cases} 1, & T(x) < k_1 \text{ 或 } T(x) > k_2 \\ \gamma_{2i}, & T(x)=k_i \ (i=1,2) \\ 0, & k_1 < T(x) < k_2 \end{cases} \]

    满足\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),则对任意\(\theta_1 \neq \theta_0\)、任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),有

    \[\mathbb{E}_{\theta_1}[\phi_2(X)] \geq \mathbb{E}_{\theta_1}[\tilde{\phi}(X)] \]

  2. UMPUT结论:上述\(\phi_2(x)\)是检验问题(iii)的一致最优无偏检验(UMPUT),即检验(iii)的UMPUT必为双边拒绝域形式,且满足约束

    \[\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha, \quad \mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \]


三、定理的分步严格证明

证明(1):双约束检验类中的一致最优性

步骤1:匹配推广N-P引理的记号

为应用推广的N-P引理,定义三个密度函数:

  • 原假设密度:\(f_1(x) = f(x,\theta_0) = a(\theta_0)h(x)e^{Q(\theta_0)T(x)}\),对应第一个约束\(\int \phi f_1 d\mu = \alpha_1 = \alpha\)
  • 辅助密度:\(f_2(x) = T(x)f(x,\theta_0) = T(x)a(\theta_0)h(x)e^{Q(\theta_0)T(x)}\),对应第二个约束\(\int \phi f_2 d\mu = \alpha_2 = \alpha\mathbb{E}_{\theta_0}[T(X)]\)
  • 备择假设密度:\(f_3(x) = f(x,\theta_1) = a(\theta_1)h(x)e^{Q(\theta_1)T(x)}\),其中\(\theta_1 \neq \theta_0\)为任意备择点。

根据定义,对任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),恰好满足推广N-P引理的双等式约束:

\[\int_{\mathcal{X}} \tilde{\phi}(x)f_1(x)d\mu(x) = \alpha_1, \quad \int_{\mathcal{X}} \tilde{\phi}(x)f_2(x)d\mu(x) = \alpha_2 \]

步骤2:构造推广N-P引理的拒绝域

根据推广的N-P引理,最大化\(\mathbb{E}_{\theta_1}[\phi(X)]\)的检验,其拒绝域为:

\[R^+ = \left\{ x: f_3(x) > c_1f_1(x) + c_2f_2(x) \right\} \]

将指数族密度代入,两边除以恒正的\(h(x)e^{Q(\theta_0)T(x)}\),化简得:

\[a(\theta_1)e^{[Q(\theta_1)-Q(\theta_0)]T(x)} > c_1a(\theta_0) + c_2a(\theta_0)T(x) \]

\(b = Q(\theta_1)-Q(\theta_0)\)(因\(Q(\theta)\)严格单调,\(b\neq0\)),\(d_1 = \frac{c_1a(\theta_0)}{a(\theta_1)}\)\(d_2 = \frac{c_2a(\theta_0)}{a(\theta_1)}\),则拒绝域等价于:

\[R^+ = \left\{ x: T(x)=t,\ e^{bt} > d_1 + d_2t \right\} \]

步骤3:排除无效的拒绝域形式

指数函数\(e^{bt}\)与直线\(d_1+d_2t\)的交点数仅有3种可能,我们逐一排除不符合约束的情形:

  1. 无交点:此时\(e^{bt} > d_1+d_2t\)对所有\(t\)成立,\(R^+=\mathcal{X}\),即\(\phi_2(x)\equiv1\),此时\(\mathbb{E}_{\theta_0}[\phi_2]=1\),与\(0<\alpha<1\)矛盾,排除。
  2. 仅有1个交点:此时拒绝域为单边形式\(R^+=\{T(x)<k\}\)\(\{T(x)>k\}\),对应的检验是单边检验。
    单边检验的功效函数是关于\(\theta\)的严格单调函数,因此\(\beta'(\theta_0) \neq 0\),不满足无偏性的等价约束\(\mathbb{E}_{\theta_0}[\phi T] = \alpha\mathbb{E}_{\theta_0}[T]\),即无法满足\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),排除。
  3. 有2个交点:这是唯一可行的情形。设两个交点为\(k_1<k_2\),则\(e^{bt} > d_1+d_2t\)的解为\(t<k_1\)\(t>k_2\),即拒绝域为:

    \[R^+ = \{x: T(x)<k_1 \text{ 或 } T(x)>k_2\} \]

    完全匹配双边拒绝域检验\(\phi_2(x)\)的形式。

步骤4:一致最优性证明

\(\phi_2(x) \in \widetilde{\Phi}'_\alpha\),则满足推广N-P引理的双等式约束,根据推广N-P引理的结论(1),对任意\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),有:

\[\int_{\mathcal{X}} \phi_2(x)f_3(x)d\mu(x) \geq \int_{\mathcal{X}} \tilde{\phi}(x)f_3(x)d\mu(x) \]

\(\mathbb{E}_{\theta_1}[\phi_2(X)] \geq \mathbb{E}_{\theta_1}[\tilde{\phi}(X)]\)

同时,\(\phi_2(x)\)的形式与备择点\(\theta_1\)无关,因此该不等式对所有\(\theta_1 \neq \theta_0\)成立,即\(\phi_2(x)\)\(\widetilde{\Phi}'_\alpha\)中是一致最优的。


证明(2):\(\phi_2(x)\)是检验(iii)的UMPUT

要证明\(\phi_2(x)\)是UMPUT,需完成两步:证明\(\phi_2(x)\)是无偏检验 + 证明\(\phi_2(x)\)在所有无偏检验中一致最优

步骤1:证明\(\phi_2(x)\)是水平为\(\alpha\)的无偏检验

无偏检验要求:

  • 原假设上:\(\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha\)(已由约束满足);
  • 备择假设上:对任意\(\theta \neq \theta_0\)\(\mathbb{E}_\theta[\phi_2(X)] \geq \alpha\)

取基准检验\(\tilde{\phi}(x) \equiv \alpha\),验证其属于\(\widetilde{\Phi}'_\alpha\)

  • \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)] = \mathbb{E}_{\theta_0}[\alpha] = \alpha\),满足第一个约束;
  • \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)T(X)] = \mathbb{E}_{\theta_0}[\alpha T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\),满足第二个约束。

因此\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),根据证明(1)的最优性结论,对任意\(\theta \neq \theta_0\),有:

\[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] = \alpha \]

完美满足无偏性要求,即\(\phi_2(x)\)是检验(iii)的水平为\(\alpha\)的无偏检验。

步骤2:证明在所有无偏检验中一致最优

\(\tilde{\phi}(x)\)是检验(iii)的任意一个水平为\(\alpha\)的无偏检验,根据引理6.4.3,无偏检验必须满足:

  1. \(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)] = \alpha\)
  2. \(\beta'(\theta_0)=0\),等价于\(\mathbb{E}_{\theta_0}[\tilde{\phi}(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)

因此\(\tilde{\phi}(x) \in \widetilde{\Phi}'_\alpha\),根据证明(1)的结论,对任意\(\theta \neq \theta_0\),有:

\[\mathbb{E}_\theta[\phi_2(X)] \geq \mathbb{E}_\theta[\tilde{\phi}(X)] \]

\(\phi_2(x)\)在所有水平为\(\alpha\)的无偏检验中,对备择假设全空间的功效一致最高,因此\(\phi_2(x)\)是检验(iii)的UMPUT。


四、定理的核心意义与补充说明

1. 理论价值

  1. 彻底解决了点原假设双侧检验的最优性问题:证明了单参数指数族下,点原假设双侧检验的UMPUT必为双边拒绝域检验,给出了检验的标准形式与定解条件。
  2. 完成了双边检验的理论闭环:从单边检验的UMPT,到区间原假设双边检验的UMPT/UMPUT,再到点原假设双侧检验的UMPUT,形成了完整的单参数指数族假设检验最优性理论体系。
  3. 揭示了经典双侧检验的理论依据:我们常用的正态分布双侧z检验、t检验,二项分布双侧检验等,本质上都是该定理的特例,其最优性由该定理保证。

2. 应用说明

定理给出的定解条件\(\mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)在计算中可大幅简化:

  • 若充分统计量\(T(X)\)的分布关于\(\mathbb{E}_{\theta_0}[T(X)]\)对称(如正态分布),可直接取对称临界值\(k_1 = \mathbb{E}[T] - k\)\(k_2 = \mathbb{E}[T] + k\),此时两个约束可合并为\(\mathbb{E}_{\theta_0}[\phi_2(X)] = \alpha\),无需额外计算第二个约束。
  • 对于非对称分布(如指数分布、二项分布),需通过两个约束方程联立求解临界值\(k_1,k_2\)

3. 与全局UMPT的区别

该定理得到的是UMPUT(一致最优无偏检验),而非全局UMPT,原因与检验(ii)一致:
检验构造中用到的推广N-P引理结论(1)仅对等式约束的检验类成立,无法覆盖所有水平为\(\alpha\)的检验,因此仅能在无偏检验类中得到最优性,不存在全局UMPT。


五、三类双边检验核心结论总结表

检验问题 原假设\(H_0\) 备择假设\(H_1\) 最优检验类型 检验形式 定解条件
检验(i) \(\theta\leq\theta_1\)\(\theta\geq\theta_2\) \(\theta_1<\theta<\theta_2\) 全局UMPT 中间拒绝域:\(k_1<T<k_2\)时拒绝 \(\mathbb{E}_{\theta_1}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)
检验(ii) \(\theta_1\leq\theta\leq\theta_2\) \(\theta<\theta_1\)\(\theta>\theta_2\) UMPUT 双边拒绝域:\(T<k_1\)\(T>k_2\)时拒绝 \(\mathbb{E}_{\theta_1}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)
检验(iii) \(\theta=\theta_0\) \(\theta\neq\theta_0\) UMPUT 双边拒绝域:\(T<k_1\)\(T>k_2\)时拒绝 \(\mathbb{E}_{\theta_0}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_0}[\phi T]=\alpha\mathbb{E}_{\theta_0}[T]\)

定理6.4.5 对称分布下双侧检验的简化UMPUT 完整讲解与证明

一、定理背景与核心价值

在定理6.4.4中,我们得到了点原假设双侧检验\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta\neq\theta_0\)的UMPUT,但其需要两个联立的定解条件:

\[\mathbb{E}_{\theta_0}[\phi(X)] = \alpha, \quad \mathbb{E}_{\theta_0}[\phi(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)] \]

实际计算中需要通过这两个方程求解两个临界值\(k_1,k_2\),过程较为复杂。

而在数理统计的实际应用中,大量常见分布(如正态分布、t分布、对称二项分布等)的充分统计量\(T(X)\),在原假设\(\theta=\theta_0\)下服从对称分布。定理6.4.5正是针对这一高频场景,给出了简化的UMPUT形式,证明了对称场景下第二个定解条件会自动满足,仅需一个条件即可确定检验的临界值,大幅降低了计算难度。


二、定理6.4.5 正式表述

条件:同定理6.4.4,针对单参数指数族分布的点原假设双侧检验问题(iii),且当\(\theta=\theta_0\)时,充分统计量\(T=T(X)\)的分布关于点\(\mu_0\)对称。

结论:检验问题(iii)的UMPUT可表示为对称等尾形式:

\[\phi_2(t) = \begin{cases} 1, & |t - \mu_0| > k \\ \gamma, & |t - \mu_0| = k \\ 0, & |t - \mu_0| < k \end{cases} \tag{6.4.25} \]

其中临界值\(k\)和随机化参数\(\gamma\),仅由条件\(\mathbb{E}_{\theta_0}[\phi_2(T)] = \alpha\)唯一确定,第二个定解条件\(\mathbb{E}_{\theta_0}[\phi_2(X)T(X)] = \alpha\mathbb{E}_{\theta_0}[T(X)]\)可自动满足,无需额外计算。


三、定理的分步严格证明

证明的核心目标:验证对称形式的检验函数\(\phi_2(t)\),会自动满足定理6.4.4的第二个定解条件,因此仅需一个约束即可确定检验。

步骤1:明确对称分布的核心性质

\(\theta=\theta_0\)时,\(T(X)\)的概率密度为\(g(t)\)(离散分布可替换为分布律,证明逻辑完全一致),分布关于\(\mu_0\)对称,即满足两个核心性质:

  1. 密度对称性:对任意\(\tau\),有\(g(\mu_0 + \tau) = g(\mu_0 - \tau)\),即\(g(\mu_0+\tau)\)是关于\(\tau\)的偶函数;
  2. 期望匹配对称中心:若\(T\)的期望存在,则\(\mathbb{E}_{\theta_0}[T(X)] = \mu_0\)(对称分布的期望等于其对称中心)。

同时,我们构造的检验函数\(\phi_2(t)\)仅由\(|t-\mu_0|\)决定,因此也关于\(\mu_0\)对称,即\(\phi_2(\mu_0+\tau) = \phi_2(\mu_0-\tau)\)\(\phi_2(\mu_0+\tau)\)也是关于\(\tau\)的偶函数。

步骤2:展开目标期望的积分式

我们需要验证的第二个定解条件为\(\mathbb{E}_{\theta_0}[\phi_2(T)T] = \alpha\mathbb{E}_{\theta_0}[T]\),根据期望的定义展开:

\[\mathbb{E}_{\theta_0}[\phi_2(T)T] = \int_{-\infty}^{+\infty} \phi_2(t) \cdot t \cdot g(t) dt \]

做变量替换,令\(t = \mu_0 + \tau\),则\(dt=d\tau\),积分上下限不变,代入后拆分积分:

\[\begin{aligned} \mathbb{E}_{\theta_0}[\phi_2(T)T] &= \int_{-\infty}^{+\infty} \phi_2(\mu_0+\tau) \cdot (\mu_0 + \tau) \cdot g(\mu_0+\tau) d\tau \\ &= \mu_0 \int_{-\infty}^{+\infty} \phi_2(\mu_0+\tau) g(\mu_0+\tau) d\tau + \int_{-\infty}^{+\infty} \tau \cdot \phi_2(\mu_0+\tau) g(\mu_0+\tau) d\tau \end{aligned} \]

步骤3:分别计算两个积分项

第一项积分:匹配定解条件

对第一项做变量回代\(\tau = t-\mu_0\),积分可还原为期望形式:

\[\mu_0 \int_{-\infty}^{+\infty} \phi_2(\mu_0+\tau) g(\mu_0+\tau) d\tau = \mu_0 \cdot \mathbb{E}_{\theta_0}[\phi_2(T)] \]

根据检验的水平约束,\(\mathbb{E}_{\theta_0}[\phi_2(T)] = \alpha\),且对称分布满足\(\mathbb{E}_{\theta_0}[T] = \mu_0\),因此第一项可化简为:

\[\mu_0 \cdot \alpha = \alpha \cdot \mathbb{E}_{\theta_0}[T] \]

这正是我们需要验证的定解条件的右侧。

第二项积分:奇函数的对称积分等于0

令被积函数\(h(\tau) = \tau \cdot \phi_2(\mu_0+\tau) \cdot g(\mu_0+\tau)\),我们证明\(h(\tau)\)是关于\(\tau\)的奇函数:

\[\begin{aligned} h(-\tau) &= (-\tau) \cdot \phi_2(\mu_0 - \tau) \cdot g(\mu_0 - \tau) \\ &= -\tau \cdot \phi_2(\mu_0 + \tau) \cdot g(\mu_0 + \tau) \quad (\phi_2和g均为关于\tau的偶函数) \\ &= -h(\tau) \end{aligned} \]

根据积分性质,奇函数在对称区间\((-\infty,+\infty)\)上的定积分恒为0,因此第二项积分:

\[\int_{-\infty}^{+\infty} \tau \cdot \phi_2(\mu_0+\tau) g(\mu_0+\tau) d\tau = 0 \]

步骤4:合并结果完成证明

将两项积分的结果合并,得到:

\[\mathbb{E}_{\theta_0}[\phi_2(T)T] = \alpha \mathbb{E}_{\theta_0}[T] + 0 = \alpha \mathbb{E}_{\theta_0}[T] \]

这说明对称形式的检验函数\(\phi_2(t)\),自动满足定理6.4.4的第二个定解条件。结合定理6.4.4的结论,\(\phi_2(t)\)满足UMPUT的所有要求,因此是检验问题(iii)的UMPUT,且仅需通过\(\mathbb{E}_{\theta_0}[\phi_2(T)]=\alpha\)即可确定临界值\(k\)和随机化参数\(\gamma\)


四、定理的核心应用与经典实例

该定理是绝大多数常用双侧检验的理论依据,我们以最经典的正态分布双侧检验为例说明:

实例1:正态总体均值的双侧z检验

设样本\(X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)\),其中\(\sigma^2\)已知,检验问题为:

\[H_0:\mu=\mu_0 \longleftrightarrow H_1:\mu\neq\mu_0 \]

  1. 充分统计量为样本均值\(\bar{X}\),在\(H_0\)下,\(\bar{X} \sim N\left(\mu_0, \frac{\sigma^2}{n}\right)\),分布关于\(\mu_0\)对称,符合定理6.4.5的条件。
  2. 根据定理,UMPUT为对称等尾形式:当\(|\bar{X}-\mu_0|>k\)时拒绝\(H_0\)
  3. 临界值\(k\)仅由水平条件\(\mathbb{P}_{\mu_0}(|\bar{X}-\mu_0|>k)=\alpha\)确定,解得\(k = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}\),其中\(z_{\alpha/2}\)为标准正态分布的上\(\alpha/2\)分位数。

这就是我们日常使用的双侧z检验,定理6.4.5严格证明了该检验是无偏检验类中的一致最优检验。

实例2:正态总体均值的双侧t检验

设样本\(X_1,X_2,\dots,X_n \sim N(\mu,\sigma^2)\),其中\(\sigma^2\)未知,检验问题同上。

  1. 构造检验统计量\(t = \frac{\bar{X}-\mu_0}{S/\sqrt{n}}\)\(S\)为样本标准差),在\(H_0\)下,\(t\)服从自由度为\(n-1\)的t分布,分布关于0对称,符合定理条件。
  2. UMPUT为对称等尾形式:当\(|t|>k\)时拒绝\(H_0\),临界值\(k=t_{\alpha/2}(n-1)\),即t分布的上\(\alpha/2\)分位数,仅由水平条件\(\mathbb{P}(|t|>k)=\alpha\)确定。

五、定理的核心意义总结

  1. 计算简化:将对称分布下双侧检验的两个定解条件合并为一个,无需求解复杂的联立方程,大幅降低了实际应用的计算成本。
  2. 理论支撑:为经典的双侧z检验、t检验、对称分布的双侧卡方检验等常用方法,提供了严格的最优性理论依据,证明了这些检验在无偏检验类中是一致最优的。
  3. 实践指导:明确了对称分布下双侧检验的最优形式是等尾对称拒绝域,解释了为什么实际应用中双侧检验几乎都采用等尾临界值,而非非对称的临界值组合。
  4. 适用范围:不仅适用于连续对称分布,对离散对称分布(如\(p=0.5\)的二项分布)同样适用,仅需通过随机化参数\(\gamma\)匹配显著性水平\(\alpha\)即可。

小节归纳

单参数指数族双边检验 全知识点汇总表

以下表格完整覆盖上述所有核心知识点,从基础概念、检验分类、核心引理、关键定理、维度对比到实际应用,形成完整的知识体系。


表1 核心基础概念定义表

术语 符号/数学定义 核心含义
单参数指数族 \(f(x,\theta) = a(\theta)h(x)e^{Q(\theta)T(x)}\) 数理统计核心分布族,\(Q(\theta)\)\(\theta\)的严格增函数,\(T(x)\)\(\theta\)充分统计量,包含样本中关于\(\theta\)的全部信息
检验函数 \(\phi(x)\) 观测到样本\(x\)时拒绝原假设\(H_0\)的概率,满足\(0\leq\phi(x)\leq1\);非随机化检验中仅取0(接受)或1(拒绝)
功效函数 \(\beta(\theta) = \mathbb{E}_\theta[\phi(X)]\) 参数为\(\theta\)时拒绝\(H_0\)的概率;原假设上为第一类错误概率,备择假设上\(1-\beta(\theta)\)为第二类错误概率
水平为\(\alpha\)的检验 对所有\(\theta\in\Theta_0\)\(\beta(\theta)\leq\alpha\) 原假设成立时,错误拒绝\(H_0\)的概率不超过显著性水平\(\alpha\)
无偏检验 原假设上\(\beta(\theta)\leq\alpha\);备择假设上\(\beta(\theta)\geq\alpha\) 备择假设成立时拒绝\(H_0\)的概率,不低于原假设成立时错误拒绝的概率,保证检验对备择假设的识别能力
UMPT(一致最优检验) 所有水平为\(\alpha\)的检验中,对任意\(\theta\in\Theta_1\)\(\beta(\theta)\)一致最大的检验 全检验类中的全局最优检验,在备择全空间上功效最高
UMPUT(一致最优无偏检验) 所有水平为\(\alpha\)的无偏检验中,对任意\(\theta\in\Theta_1\)\(\beta(\theta)\)一致最大的检验 无偏检验类中的局部最优检验,双边检验无全局UMPT时的最优解

表2 三类标准双边检验问题汇总表

检验编号 别称 原假设\(H_0\) 备择假设\(H_1\) 核心特征
(i) 带内检验/区间备择检验 \(\theta\leq\theta_1\)\(\theta\geq\theta_2\) \(\theta_1<\theta<\theta_2\) 备择假设在原假设的中间区间,功效函数为「两头小中间大」的单峰凹函数
(ii) 带外检验/区间原假设检验 \(\theta_1\leq\theta\leq\theta_2\) \(\theta<\theta_1\)\(\theta>\theta_2\) 备择假设在原假设的两侧区间,功效函数为「中间小两头大」的凸函数
(iii) 点原假设双侧检验 \(\theta=\theta_0\) \(\theta\neq\theta_0\) 检验(ii)的特例(\(\theta_1=\theta_2=\theta_0\)),最常用的双侧检验,功效函数以\(\theta_0\)为极小值点的凸函数

表3 核心引理汇总表

引理名称 核心适用场景 核心内容与结论 理论价值
推广的Neyman-Pearson引理 多约束条件下的最优势检验(MPT)构造 最优检验拒绝域为\(f_3(x) > c_1f_1(x)+c_2f_2(x)\)
1. 等式约束:\(c_1,c_2\)可正可负,仅对等式约束检验类最优;
2. 不等式约束:要求\(c_1,c_2\geq0\),对所有水平为\(\alpha\)的检验最优
双边检验最优性的核心工具,是经典N-P引理在多约束场景的推广,解决了两点原假设检验的MPT构造问题
引理6.4.1 两点原假设、中间备择检验(检验(i)'/(i)'') 中间拒绝域检验\(\phi_1(x)\)\(k_1<T<k_2\)时拒绝),满足\(\mathbb{E}_{\theta_1}[\phi_1]=\mathbb{E}_{\theta_2}[\phi_1]=\alpha\)时,是所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]\leq\alpha\)的检验中的MPT 证明了中间拒绝域检验在全检验类中的最优性,为检验(i)的全局UMPT奠定基础
引理6.4.2 两点原假设、两侧备择检验(检验(ii)'/(ii)'') 双边拒绝域检验\(\phi_2(x)\)\(T<k_1\)\(T>k_2\)时拒绝),满足\(\mathbb{E}_{\theta_1}[\phi_2]=\mathbb{E}_{\theta_2}[\phi_2]=\alpha\)时,是所有满足\(\mathbb{E}_{\theta_i}[\tilde{\phi}]=\alpha\)的检验中的MPT 证明了双边拒绝域检验在等式约束检验类中的最优性,为检验(ii)的UMPUT奠定基础
引理6.4.3 点原假设双侧检验(iii)的无偏检验约束 1. 充分统计量期望:\(\mathbb{E}_\theta[T] = -\frac{a'(\theta)}{a(\theta)Q'(\theta)}\)
2. 功效函数导数:\(\beta'(\theta) = Q'(\theta)\left[\mathbb{E}_\theta[\phi T] - \mathbb{E}_\theta[T]\mathbb{E}_\theta[\phi]\right]\)
3. 无偏检验等价条件:\(\beta'(\theta_0)=0 \iff \mathbb{E}_{\theta_0}[\phi T] = \alpha\mathbb{E}_{\theta_0}[T]\)
解决了点原假设双侧检验定解条件不足的问题,给出了第二个约束的可计算形式,为检验(iii)的UMPUT提供核心约束

表4 四大核心定理汇总表

定理编号 对应检验问题 最优检验类型 检验拒绝域形式 定解条件 核心价值
6.4.2 检验(i) 带内检验 全局UMPT 中间区间拒绝:\(k_1<T<k_2\)时拒绝\(H_0\) \(\mathbb{E}_{\theta_1}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)
证明了带内检验存在全局UMPT,是双边检验中唯一的全局最优检验
6.4.3 检验(ii) 带外检验 UMPUT(无全局UMPT) 双侧区间拒绝:\(T<k_1\)\(T>k_2\)时拒绝\(H_0\) \(\mathbb{E}_{\theta_1}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_2}[\phi]=\alpha\)
证明了区间原假设双侧检验的UMPUT存在性与构造方法,明确了无偏检验类中的最优形式
6.4.4 检验(iii) 点原假设双侧检验 UMPUT(无全局UMPT) 双侧区间拒绝:\(T<k_1\)\(T>k_2\)时拒绝\(H_0\) \(\mathbb{E}_{\theta_0}[\phi]=\alpha\)
\(\mathbb{E}_{\theta_0}[\phi T]=\alpha\mathbb{E}_{\theta_0}[T]\)
彻底解决了点原假设双侧检验的最优性问题,证明了常用双侧检验的UMPUT性质
6.4.5 检验(iii) 对称分布场景 UMPUT(简化形式) 对称等尾拒绝:$ T-\mu_0 >k\(时拒绝\)H_0$

表5 三类双边检验核心维度对比表

对比维度 检验(i) 带内检验 检验(ii) 带外检验 检验(iii) 点原假设双侧检验
原假设参数空间 \(\theta\leq\theta_1\)\(\theta\geq\theta_2\) \(\theta_1\leq\theta\leq\theta_2\) \(\theta=\theta_0\)
备择假设参数空间 \(\theta_1<\theta<\theta_2\) \(\theta<\theta_1\)\(\theta>\theta_2\) \(\theta\neq\theta_0\)
最优检验类型 全局UMPT UMPUT(无全局UMPT) UMPUT(无全局UMPT)
检验拒绝域形式 中间区间拒绝 双侧区间拒绝 双侧区间拒绝(对称分布下为等尾对称拒绝)
定解条件数量 2个边界等式约束 2个边界等式约束 2个约束,对称分布下简化为1个
功效函数形态 单峰凹函数,「两头小中间大」 凸函数,「中间小两头大」 凸函数,以\(\theta_0\)为极小值点
最优性覆盖范围 所有水平为\(\alpha\)的检验 仅水平为\(\alpha\)的无偏检验 仅水平为\(\alpha\)的无偏检验
核心理论依据 推广N-P引理结论(2)(\(c_1,c_2\geq0\) 推广N-P引理结论(1) 推广N-P引理结论(1)+引理6.4.3

表6 实际应用场景与经典案例表

分布类型 检验问题 核心统计量 最优检验类型 经典检验形式 定解方式
正态分布\(N(\mu,\sigma^2)\)\(\sigma^2\)已知) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\) 样本均值\(\bar{X}\) UMPUT(对称简化形式) 双侧z检验:\(|\bar{X}-\mu_0|>z_{\alpha/2}\cdot\frac{\sigma}{\sqrt{n}}\)时拒绝 仅由\(\mathbb{P}_{\mu_0}(|\bar{X}-\mu_0|>k)=\alpha\)确定临界值
正态分布\(N(\mu,\sigma^2)\)\(\sigma^2\)未知) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\neq\mu_0\) 样本均值\(\bar{X}\)、样本标准差\(S\) UMPUT(对称简化形式) 双侧t检验:\(\left|\frac{\bar{X}-\mu_0}{S/\sqrt{n}}\right|>t_{\alpha/2}(n-1)\)时拒绝 仅由\(\mathbb{P}_{\mu_0}(|t|>k)=\alpha\)确定临界值
二项分布\(Bin(n,p)\) \(H_0:p=p_0 \leftrightarrow H_1:p\neq p_0\) 成功次数\(X\) UMPUT 双侧拒绝域:\(X<k_1\)\(X>k_2\)时拒绝 联立水平约束+无偏性约束确定临界值
指数分布\(Exp(\lambda)\) \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda\neq\lambda_0\) 样本和\(\sum_{i=1}^n X_i\) UMPUT 双侧拒绝域:\(\sum X_i<k_1\)\(\sum X_i>k_2\)时拒绝 联立水平约束+无偏性约束确定临界值
泊松分布\(Pois(\lambda)\) \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda\neq\lambda_0\) 样本和\(\sum_{i=1}^n X_i\) UMPUT 双侧拒绝域:\(\sum X_i<k_1\)\(\sum X_i>k_2\)时拒绝 联立水平约束+无偏性约束确定临界值

posted on 2026-03-03 07:25  Indian_Mysore  阅读(1)  评论(0)    收藏  举报

导航