昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.2Neyman-Pearson基本引理

Neyman-Pearson基本引理 系统讲解与完整推导

作为从事数理统计教学与研究多年的研究员,我将从背景逻辑、核心概念、定理内容、完整证明、注解补充四个维度,逐层拆解这个假设检验的基石性定理,最后用表格完成系统归纳。


一、引理的研究背景与前置核心概念

1.1 研究背景

假设检验的核心矛盾是同时控制两类错误

  • 第一类错误(弃真):\(H_0\)为真时错误拒绝\(H_0\)的概率,记为\(\alpha\),必须满足\(P(\text{拒绝}H_0|H_0) \leq \alpha\)(水平约束);
  • 第二类错误(取伪):\(H_1\)为真时错误接受\(H_0\)的概率,记为\(\beta\),我们希望最小化\(\beta\),等价于最大化检验功效\(1-\beta=P(\text{拒绝}H_0|H_1)\)

对于一般的复合假设检验(原/备择假设包含多个参数值),很难找到全局一致最优的检验。因此Neyman与Pearson从最基础的简单假设检验(原假设和备择假设均为单点参数,完全确定样本分布)入手,给出了最优检验的完整刻画,这就是N-P基本引理。后续所有复合假设的一致最优检验(UMPT),均是以此为基础推广得到的。

1.2 前置核心概念

(1)简单假设检验的标准形式

设样本\(X=(X_1,X_2,\dots,X_n)^T\)的概率密度(连续型)/概率质量函数(离散型)为\(f(x,\theta)\),简单假设检验问题为:

\[H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 \]

其中\(\theta_0,\theta_1\)为确定的不同参数值,\(H_0,H_1\)均完全确定样本分布,无未知参数。

(2)检验函数\(\phi(x)\)

定义在样本空间上、取值于\([0,1]\)的函数,含义为:观测到样本\(x\)时,拒绝原假设\(H_0\)的概率。

  • 非随机化检验:\(\phi(x)\)仅取0或1,\(\phi(x)=1\)拒绝\(H_0\)\(\phi(x)=0\)接受\(H_0\),对应拒绝域\(R=\{x:\phi(x)=1\}\)
  • 随机化检验:\(\phi(x)\)可取\([0,1]\)内任意值,核心用于离散型分布,精准控制第一类错误概率恰好等于\(\alpha\)

(3)两类错误与功效函数的数学表达

  • 第一类错误概率:\(E_{\theta_0}[\phi(X)] = \int_{\mathcal{X}} \phi(x) f(x,\theta_0) d\mu(x)\),其中\(\mu\)为Lebesgue测度(连续型)/计数测度(离散型)。满足\(E_{\theta_0}[\phi(X)] \leq \alpha\)的检验称为水平为\(\alpha\)的检验,所有此类检验构成集合\(\Phi_\alpha = \{\phi(x): E_{\theta_0}[\phi(X)] \leq \alpha\}\)
  • 功效函数:\(\beta_\phi(\theta) = E_\theta[\phi(X)]\),对备择假设\(\theta_1\)\(\beta_\phi(\theta_1) = E_{\theta_1}[\phi(X)]\),即检验在\(H_1\)下的功效,等于\(1-\beta\)(第二类错误概率的补),我们的目标是在\(\Phi_\alpha\)中找到使\(\beta_\phi(\theta_1)\)最大的检验。

(4)最优势检验(MPT)

\(\phi(x) \in \Phi_\alpha\),且对任意\(\tilde{\phi}(x) \in \Phi_\alpha\),都有:

\[E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)] \]

则称\(\phi(x)\)为该检验问题水平\(\alpha\)的最优势检验(MPT),即我们要找的最优检验。

(5)似然比统计量

定义似然比

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} \]

直观逻辑:

  • \(\lambda(x)\)很大:样本\(x\)\(H_1\)下出现的可能性远大于\(H_0\),应拒绝\(H_0\)
  • \(\lambda(x)\)很小:样本\(x\)\(H_0\)下出现的可能性远大于\(H_1\),应接受\(H_0\)
  • \(\lambda(x)\)等于临界值\(c\):通过随机化概率\(\gamma\)控制第一类错误恰好为\(\alpha\)

二、Neyman-Pearson基本引理 完整定理内容

设样本\(X \sim f(x,\theta)\)为连续型或离散型分布,对简单假设检验问题\(H_0: \theta=\theta_0 \longleftrightarrow H_1: \theta=\theta_1\),有三大核心结论:

  1. 存在性:对任意给定的显著性水平\(0<\alpha<1\),必存在常数\(c \geq 0\)\(0 \leq \gamma \leq 1\),使得如下检验函数满足\(E_{\theta_0}[\phi(X)] = \alpha\)

    \[\phi(x) = \begin{cases} 1, & x \in R^+ = \{x: \lambda(x) > c\} \\ \gamma, & x \in R^0 = \{x: \lambda(x) = c\} \\ 0, & x \in R^- = \{x: \lambda(x) < c\} \end{cases} \]

    该检验称为似然比检验

  2. 最优性(充分性):满足上述形式的检验函数\(\phi(x)\),必是该检验问题水平\(\alpha\)的最优势检验(MPT)。

  3. 唯一性(必要性):若\(\phi^*(x)\)也是该检验问题水平\(\alpha\)的MPT,则在\(R^+ \cup R^-\)上,必有\(\phi^*(x)=\phi(x)\)(几乎处处成立,a.e.);并且,若\(E_{\theta_1}[\phi^*(X)] < 1\),则必有\(E_{\theta_0}[\phi^*(X)] = \alpha\),即最优检验必然是精确水平\(\alpha\)的,不会浪费显著性水平。


三、引理的完整分步证明

3.1 证明1:存在性——对任意\(0<\alpha<1\),必存在\(c,\gamma\)使\(E_{\theta_0}[\phi(X)] = \alpha\)

首先展开\(E_{\theta_0}[\phi(X)]\)

\[\begin{align*} E_{\theta_0}[\phi(X)] &= \int_{\mathcal{X}} \phi(x) f(x,\theta_0) d\mu(x) \\ &= \int_{R^+} 1 \cdot f(x,\theta_0) d\mu(x) + \int_{R^0} \gamma \cdot f(x,\theta_0) d\mu(x) + \int_{R^-} 0 \cdot f(x,\theta_0) d\mu(x) \\ &= P_{\theta_0}(\lambda(X) > c) + \gamma P_{\theta_0}(\lambda(X) = c) \end{align*} \]

我们的目标是找到\(c,\gamma\),使得:

\[P_{\theta_0}(\lambda(X) > c) + \gamma P_{\theta_0}(\lambda(X) = c) = \alpha \tag{1} \]

定义似然比\(\lambda(X)\)\(H_0\)下的分布函数:

\[F(u) = P_{\theta_0}(\lambda(X) \leq u), \quad u \geq 0 \]

(似然比为非负函数的比值,故\(\lambda(x) \geq 0\)恒成立)

根据分布函数性质,改写(1)式:

\[\begin{align*} P_{\theta_0}(\lambda(X) > c) &= 1 - F(c) \\ P_{\theta_0}(\lambda(X) = c) &= F(c) - F(c-0) \end{align*} \]

其中\(F(c-0)\)\(F(u)\)\(c\)点的左极限。代入(1)式得:

\[1 - F(c) + \gamma [F(c) - F(c-0)] = \alpha \tag{2} \]

接下来分两种情况求解\(c\)\(\gamma\)

情况1:\(F(u)\)\(1-\alpha\)分位数\(u_{1-\alpha}\)处连续

分位数定义为\(F(u_{1-\alpha}) = 1-\alpha\),即\(P_{\theta_0}(\lambda(X) > u_{1-\alpha}) = \alpha\)
\(F(u)\)\(u_{1-\alpha}\)处连续,故\(F(u_{1-\alpha}) - F(u_{1-\alpha}-0) = 0\),即\(P_{\theta_0}(\lambda(X)=u_{1-\alpha})=0\)

\(c=u_{1-\alpha}\),代入(2)式得左边\(=1-(1-\alpha) + \gamma \cdot 0 = \alpha\),恰好满足等式。此时\(\gamma\)可取\([0,1]\)内任意值(因\(\lambda(X)=c\)的概率为0,对期望无贡献)。

该情况对应连续型分布,检验退化为非随机化检验:

\[\phi(x) = \begin{cases} 1, & \lambda(x) > c \\ 0, & \lambda(x) < c \end{cases} \]

情况2:\(F(u)\)\(u_{1-\alpha}\)处不连续(存在跳跃点)

此时\(F(u_{1-\alpha}) \geq 1-\alpha\),且\(F(u_{1-\alpha}-0) < 1-\alpha\),即\(P_{\theta_0}(\lambda(X)=u_{1-\alpha}) > 0\)

仍取\(c=u_{1-\alpha}\),从(2)式解出\(\gamma\)

\[\gamma = \frac{F(u_{1-\alpha}) - (1-\alpha)}{F(u_{1-\alpha}) - F(u_{1-\alpha}-0)} \]

验证\(\gamma\)的取值范围:

  • 分子:\(F(u_{1-\alpha}) - (1-\alpha) \geq 0\),分母\(F(u_{1-\alpha}) - F(u_{1-\alpha}-0) > 0\),故\(\gamma \geq 0\)
  • \(F(u_{1-\alpha}-0) < 1-\alpha\),故分子\(<\)分母,即\(\gamma < 1\)

因此\(0 \leq \gamma \leq 1\),满足检验函数的取值要求,代入(2)式等式成立。

该情况对应离散型分布,必须通过随机化检验精准控制第一类错误概率为\(\alpha\)

综上,对任意\(0<\alpha<1\),总能找到对应的\(c\)\(\gamma\),存在性得证。


3.2 证明2:最优性(充分性)——似然比检验必是水平\(\alpha\)的MPT

需证明:对任意\(\tilde{\phi}(x) \in \Phi_\alpha\)(即\(E_{\theta_0}[\tilde{\phi}(X)] \leq \alpha\)),有\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)]\)

首先做核心变形:由\(\lambda(x) = f(x,\theta_1)/f(x,\theta_0)\),得:

\[f(x,\theta_1) - c f(x,\theta_0) = f(x,\theta_0) [\lambda(x) - c] \]

因此样本空间三个区域的符号特征为:

  1. \(x \in R^+\)\(\lambda(x) > c\),故\(f(x,\theta_1) - c f(x,\theta_0) > 0\)
  2. \(x \in R^0\)\(\lambda(x) = c\),故\(f(x,\theta_1) - c f(x,\theta_0) = 0\)
  3. \(x \in R^-\)\(\lambda(x) < c\),故\(f(x,\theta_1) - c f(x,\theta_0) < 0\)

构造核心积分:

\[\int_{\mathcal{X}} [\phi(x) - \tilde{\phi}(x)] [f(x,\theta_1) - c f(x,\theta_0)] d\mu(x) \tag{3} \]

将积分拆分为三个区域的和,分别分析符号:

  1. \(R^+\)区域\(f(x,\theta_1)-cf(x,\theta_0) > 0\),且\(\phi(x)=1\)\(\tilde{\phi}(x) \in [0,1]\),故\(\phi(x)-\tilde{\phi}(x) \geq 0\),被积函数\(\geq 0\),积分\(\geq 0\)
  2. \(R^0\)区域\(f(x,\theta_1)-cf(x,\theta_0) = 0\),被积函数\(=0\),积分\(=0\)
  3. \(R^-\)区域\(f(x,\theta_1)-cf(x,\theta_0) < 0\),且\(\phi(x)=0\)\(\tilde{\phi}(x) \in [0,1]\),故\(\phi(x)-\tilde{\phi}(x) \leq 0\),被积函数\(\geq 0\),积分\(\geq 0\)

综上,整体积分(3)\(\geq 0\),即:

\[\int_{\mathcal{X}} [\phi(x) - \tilde{\phi}(x)] f(x,\theta_1) d\mu(x) - c \int_{\mathcal{X}} [\phi(x) - \tilde{\phi}(x)] f(x,\theta_0) d\mu(x) \geq 0 \tag{4} \]

将积分转化为期望形式:

  • 第一个积分:\(E_{\theta_1}[\phi(X)] - E_{\theta_1}[\tilde{\phi}(X)]\)
  • 第二个积分:\(E_{\theta_0}[\phi(X)] - E_{\theta_0}[\tilde{\phi}(X)] = \alpha - E_{\theta_0}[\tilde{\phi}(X)] \geq 0\)(因\(\tilde{\phi} \in \Phi_\alpha\))。

代入(4)式得:

\[E_{\theta_1}[\phi(X)] - E_{\theta_1}[\tilde{\phi}(X)] \geq c \left[ \alpha - E_{\theta_0}[\tilde{\phi}(X)] \right] \geq 0 \]

因此\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)]\),即似然比检验的功效是所有水平\(\alpha\)检验中最大的,最优性得证。


3.3 证明3:唯一性(必要性)——MPT的结构唯一性与精确水平性质

分两步证明:

第一步:MPT在\(R^+ \cup R^-\)上几乎处处等于\(\phi(x)\)

\(\phi^*(x)\)也是水平\(\alpha\)的MPT,由MPT的定义,\(\phi(x)\)\(\phi^*(x)\)的功效必然相等,即\(E_{\theta_1}[\phi(X)] = E_{\theta_1}[\phi^*(X)]\)

将最优性证明中的\(\tilde{\phi}(x)\)替换为\(\phi^*(x)\),则积分(3)的等号必须成立:

\[\int_{R^+ \cup R^-} [\phi(x) - \phi^*(x)] [f(x,\theta_1) - c f(x,\theta_0)] d\mu(x) = 0 \tag{5} \]

被积函数在\(R^+ \cup R^-\)上非负,非负可测函数的积分为0,当且仅当函数在积分区域上几乎处处为0

而在\(R^+ \cup R^-\)上,\(f(x,\theta_1) - c f(x,\theta_0) \neq 0\),因此必须有\(\phi(x) - \phi^*(x) = 0\)(a.e.),即\(\phi^*(x)=\phi(x)\)\(R^+ \cup R^-\)上几乎处处成立。

第二步:若\(E_{\theta_1}[\phi^*(X)] < 1\),则\(E_{\theta_0}[\phi^*(X)] = \alpha\)

\(E_{\theta_1}[\phi(X)] = E_{\theta_1}[\phi^*(X)]\),得(4)式等号成立:

\[c \left[ \alpha - E_{\theta_0}[\phi^*(X)] \right] = 0 \]

用反证法证明\(c \neq 0\):若\(c=0\),则\(R^+ = \{x:\lambda(x)>0\} = \{x:f(x,\theta_1)>0\}\),此时:

\[E_{\theta_1}[\phi^*(X)] = E_{\theta_1}[\phi(X)] = \int_{R^+} f(x,\theta_1) d\mu(x) = 1 \]

与前提\(E_{\theta_1}[\phi^*(X)] < 1\)矛盾,故\(c \neq 0\)

因此必须有\(\alpha - E_{\theta_0}[\phi^*(X)] = 0\),即\(E_{\theta_0}[\phi^*(X)] = \alpha\)

综上,唯一性得证。


四、关键注解与补充说明

  1. 唯一性的边界:唯一性仅在\(\lambda(x) \neq c\)\(R^+ \cup R^-\)区域成立;在\(\lambda(x)=c\)\(R^0\)区域,MPT的取值可以不同,不影响最优性。连续型分布中\(R^0\)是零测集,因此MPT唯一;离散型分布中\(R^0\)非零测,可存在多个MPT。
  2. 似然比的极端情况处理
    • \(\lambda(x)=0\)\(f(x,\theta_1)=0, f(x,\theta_0) \neq 0\)):样本在\(H_1\)下不可能出现,取\(\phi(x)=0\),不拒绝\(H_0\)
    • \(\lambda(x)=+\infty\)\(f(x,\theta_1) \neq 0, f(x,\theta_0)=0\)):样本在\(H_0\)下不可能出现,取\(\phi(x)=1\),拒绝\(H_0\)
    • \(f(x,\theta_1)=f(x,\theta_0)=0\):约定\(\lambda(x)=0\)\(\phi(x)=0\),不影响检验性质。
  3. 适用范围:引理仅适用于简单假设检验;对复合假设,需对分布族增加限制(如单调似然比分布族、指数族),才能基于该引理推广得到一致最优检验。

五、核心内容系统归纳表

分类维度 详细内容
核心研究问题 简单假设检验\(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1\),在控制第一类错误≤α的前提下,找到最大化功效的最优势检验(MPT)
核心统计量 似然比\(\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)}\),即样本在\(H_1\)\(H_0\)下的似然函数比值
最优检验函数构造 $$\phi(x) = \begin{cases} 1, & \lambda(x) > c \ \gamma, & \lambda(x) = c \ 0, & \lambda(x) < c \end{cases}$$ 其中\(c\)为临界值,\(\gamma\)为随机化概率,用于精准控制第一类错误为α
三大核心结论 1. 存在性:对任意\(0<\alpha<1\),必存在\(c≥0\)\(0≤γ≤1\),使\(E_{\theta_0}[\phi(X)]=\alpha\)
2. 最优性:上述似然比检验必是水平α的MPT,功效在所有水平≤α的检验中最大;
3. 唯一性:所有MPT在\(\lambda(x)≠c\)的区域上几乎处处等于该似然比检验;若MPT功效<1,则其第一类错误概率必等于α
连续型分布简化形式 似然比取单点值的概率为0,无需随机化,检验退化为:$$\phi(x) = \begin{cases} 1, & \lambda(x) > c \ 0, & \lambda(x) < c \end{cases}$$
离散型分布随机化参数 随机化概率\(\gamma = \frac{F(u_{1-α}) - (1-α)}{F(u_{1-α}) - F(u_{1-α}-0)}\),其中\(F(u)\)\(\lambda(X)\)\(H_0\)下的分布函数,\(u_{1-α}\)\(1-α\)分位数
适用场景 仅适用于简单假设检验;可推广至单调似然比分布族的单边复合检验、指数族双边检验等场景
核心理论意义 1. 彻底解决了简单假设下最优检验的构造问题;
2. 奠定了频率学派假设检验的理论基石,是所有参数假设检验方法的理论基础;
3. 确立了“控制第一类错误,最大化功效”的Neyman-Pearson准则,成为现代假设检验的通用框架

N-P引理的核心推论与无偏性定理 系统讲解与证明

承接上一讲的Neyman-Pearson基本引理,本讲将系统拆解其三大实用推论、最优检验的无偏性定理,完成从理论到应用的落地——这些内容是经典参数假设检验的核心理论支撑,解决了似然比检验的降维计算、简化构造、性质保障三大核心问题。


一、N-P引理的三大核心推论

N-P基本引理给出了简单假设最优检验的似然比形式,但原始形式直接依赖样本联合密度,实际应用中计算复杂。三大推论分别从阈值检验的水平控制、充分统计量降维、单调似然比简化三个维度,将N-P引理推广到更易落地的场景。

推论1:任意统计量的阈值型检验的水平可控性

核心结论

对任意统计量 \(T=T(X)\),构造如下阈值型检验函数:

\[\phi(x) = \begin{cases} 1, & T(x) > c \\ \gamma, & T(x) = c \\ 0, & T(x) < c \end{cases} \]

则对任意给定的 \(0<\alpha<1\),必存在常数 \(c \geq 0\)\(0 \leq \gamma \leq 1\),使得 \(E_{\theta_0}[\phi(X)] = \alpha\),即检验的第一类错误概率可精准控制在显著性水平\(\alpha\)

证明逻辑

该结论的证明完全复用N-P引理存在性的推导框架,仅需将似然比\(\lambda(x)\)替换为任意统计量\(T(x)\)

  1. \(T(X)\)\(H_0\)下的分布函数为\(F_T(u) = P_{\theta_0}(T(X) \leq u)\),检验的第一类错误概率可展开为:

    \[E_{\theta_0}[\phi(X)] = P_{\theta_0}(T(X) > c) + \gamma P_{\theta_0}(T(X) = c) = \alpha \]

  2. \(c\)\(F_T(u)\)\(1-\alpha\)分位数\(u_{1-\alpha}\)
    • \(u_{1-\alpha}\)\(F_T(u)\)的连续点,则\(P_{\theta_0}(T(X)=c)=0\),此时\(P_{\theta_0}(T(X)>c)=\alpha\)\(\gamma\)可取\([0,1]\)内任意值;
    • \(u_{1-\alpha}\)\(F_T(u)\)的跳跃点,则可解出随机化概率:

      \[\gamma = \frac{F_T(u_{1-\alpha}) - (1-\alpha)}{F_T(u_{1-\alpha}) - F_T(u_{1-\alpha}-0)} \]

      可验证\(0 \leq \gamma \leq 1\),且代入后恰好满足\(E_{\theta_0}[\phi(X)] = \alpha\)

应用意义

该推论是所有经典假设检验的通用构造基础:我们日常使用的t检验、卡方检验、F检验等,均为“统计量超过临界值则拒绝原假设”的阈值型检验,该推论保证了这类检验总能通过调整临界值,精准控制第一类错误概率,为检验的显著性水平设定提供了理论依据。


推论2:基于充分统计量的最优检验降维

核心结论

\(T=T(X)\)是参数\(\theta\)充分统计量,且\(T\)的概率密度/质量函数为\(g(t,\theta)\),则N-P引理的最优势检验(MPT)可完全基于充分统计量\(T\)构造,形式为:

\[\phi(t) = \begin{cases} 1, & t \in R^+ = \{t: \lambda(t) > c\} \\ \gamma, & t \in R^0 = \{t: \lambda(t) = c\} \\ 0, & t \in R^- = \{t: \lambda(t) < c\} \end{cases} \]

其中似然比\(\lambda(t) = \frac{g(t,\theta_1)}{g(t,\theta_0)}\),临界值\(c\)和随机化概率\(\gamma\)\(E_{\theta_0}[\phi(T)] = \alpha\)决定。

证明逻辑

核心依据是因子分解定理:若\(T\)\(\theta\)的充分统计量,则样本的联合密度可分解为:

\[f(x,\theta) = g(T(x),\theta) \cdot h(x) \]

其中\(g(\cdot)\)仅通过\(T(x)\)依赖样本,\(h(x)\)与参数\(\theta\)无关。

将其代入原始似然比,可直接化简:

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = \frac{g(T(x),\theta_1) \cdot h(x)}{g(T(x),\theta_0) \cdot h(x)} = \frac{g(T(x),\theta_1)}{g(T(x),\theta_0)} = \lambda(T(x)) \]

可见,样本的似然比\(\lambda(x)\)完全是充分统计量\(T\)的函数,与原始样本的其他信息无关。因此N-P引理的最优检验,可完全基于低维的充分统计量\(T\)构造,无需使用原始高维样本。

应用意义

该推论是假设检验的核心降维工具:

  1. 充分统计量包含了样本中关于参数\(\theta\)的全部信息,基于充分统计量构造的检验不会损失任何样本信息,依然是全局最优的MPT;
  2. 极大简化计算:例如正态分布\(N(\mu,\sigma^2)\)中,样本均值\(\bar{X}\)\(\mu\)的充分统计量,构造检验时仅需使用1维的\(\bar{X}\),无需处理n个原始样本;
  3. 为后续指数族分布的检验构造奠定了基础,指数族分布的充分统计量维度固定,不随样本量增长,是实际应用中最常用的分布族。

推论3:单调似然比下的检验形式简化

核心结论

若似然比\(\lambda(x)\)是某统计量\(T(x)\)的严格增函数,即\(\lambda(x) = h(T(x))\),其中\(h(\cdot)\)为严格增函数,则N-P引理的最优似然比检验,等价于基于\(T(x)\)的阈值型检验,形式为:

\[\phi(x) = \begin{cases} 1, & x \in R^+ = \{x: T(x) > k\} \\ \gamma, & x \in R^0 = \{x: T(x) = k\} \\ 0, & x \in R^- = \{x: T(x) < k\} \end{cases} \]

其中临界值\(k\)和随机化概率\(\gamma\)\(E_{\theta_0}[\phi(T)] = \alpha\)决定。

证明逻辑

核心是严格增函数的保序性
N-P引理的拒绝域为\(\lambda(x) > c\),代入\(\lambda(x)=h(T(x))\),因\(h(\cdot)\)严格增,不等式方向保持不变:

\[\lambda(x) > c \iff h(T(x)) > c \iff T(x) > h^{-1}(c) \]

\(k = h^{-1}(c)\),则拒绝域等价于\(T(x) > k\);同理,\(\lambda(x)=c\)等价于\(T(x)=k\)\(\lambda(x)<c\)等价于\(T(x)<k\)。因此似然比检验完全等价于基于\(T(x)\)的阈值型检验,\(k\)\(\gamma\)的确定方法与推论1完全一致。

补充说明:若\(h(\cdot)\)为严格减函数,则不等式方向反转,拒绝域变为\(T(x) < k\),实际应用中需注意单调性方向。

应用意义

该推论是单边复合假设的一致最优检验(UMPT)的核心理论基础:

  1. 二项分布、泊松分布、正态分布、指数分布等常用分布,均属于单调似然比分布族,其似然比是样本和/样本均值的单调函数,可直接通过该推论构造最优检验;
  2. 它将复杂的似然比计算,简化为我们熟悉的“统计量与临界值比较”的形式,是日常使用的单样本t检验、比例检验、泊松分布检验的直接理论依据。

二、最优检验的无偏性定理

前置定义:无偏检验

对于水平为\(\alpha\)的检验\(\phi(x)\),若对所有备择假设的参数\(\theta \in \Theta_1\),都满足:

\[E_{\theta}[\phi(X)] \geq \alpha \]

则称\(\phi(x)\)水平\(\alpha\)的无偏检验

直观意义:无偏检验在备择假设下拒绝原假设的概率(检验功效),至少不低于第一类错误的概率\(\alpha\)——即检验“正确拒绝的概率”不低于“错误拒绝的概率”,这是一个有效检验的基本要求。

定理6.2.2 最优检验的无偏性

核心结论

\(\phi(x)\)是简单假设检验问题 \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1\) 的水平\(\alpha\)的最优势检验(MPT),且\(0<\alpha<1\),则:

  1. 必有 \(E_{\theta_1}[\phi(X)] \geq \alpha\),即N-P引理给出的最优检验一定是无偏检验;
  2. \(\mu\{x: f(x,\theta_0) \neq f(x,\theta_1)\} > 0\)(即原假设与备择假设对应的分布不完全相同,检验问题有实际区分意义),则必有 \(E_{\theta_1}[\phi(X)] > \alpha\),即最优检验是严格无偏的,功效严格大于显著性水平。

完整证明过程

第一步:证明 \(E_{\theta_1}[\phi(X)] \geq \alpha\)

构造一个平凡检验\(\tilde{\phi}(x) \equiv \alpha\),即无论样本取值如何,均以固定概率\(\alpha\)拒绝原假设。

  1. 验证该检验属于水平\(\alpha\)的检验集合\(\Phi_\alpha\)

    \[E_{\theta_0}[\tilde{\phi}(X)] = E_{\theta_0}[\alpha] = \alpha \leq \alpha \]

    满足第一类错误的水平约束,因此\(\tilde{\phi} \in \Phi_\alpha\)
  2. \(\phi(x)\)是MPT的定义,对所有\(\tilde{\phi} \in \Phi_\alpha\),都有\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)]\)
  3. 计算\(\tilde{\phi}(x)\)在备择假设下的功效:\(E_{\theta_1}[\tilde{\phi}(X)] = E_{\theta_1}[\alpha] = \alpha\)
  4. 因此直接得到\(E_{\theta_1}[\phi(X)] \geq \alpha\),无偏性得证。

第二步:证明当\(\mu\{x: f(x,\theta_0) \neq f(x,\theta_1)\} > 0\)时,\(E_{\theta_1}[\phi(X)] > \alpha\)

采用反证法:假设\(E_{\theta_1}[\phi(X)] = \alpha\),推导矛盾。

  1. \(E_{\theta_1}[\phi(X)] = \alpha\),结合第一步的结论,\(\tilde{\phi}(x) \equiv \alpha\)的功效与最优检验\(\phi(x)\)完全相等,因此\(\tilde{\phi}(x)\)也是该检验问题的MPT。
  2. 根据N-P引理的唯一性结论:所有MPT在\(\lambda(x) \neq c\)的区域\(R^+ \cup R^-\)上,几乎处处相等。因此在\(R^+ \cup R^-\)上,必须有\(\phi(x) = \tilde{\phi}(x) = \alpha\)(几乎处处成立)。
  3. \(\phi(x)\)的定义为:在\(R^+\)\(\phi(x)=1\),在\(R^-\)\(\phi(x)=0\)。已知\(0<\alpha<1\),因此\(1 \neq \alpha\)\(0 \neq \alpha\)。要让\(\phi(x)=\alpha\)\(R^+ \cup R^-\)上成立,唯一的可能是\(R^+ \cup R^-\)为空集。
  4. \(R^+ \cup R^-\)为空集,则整个样本空间\(\mathcal{X} = R^0 = \{x: \lambda(x)=c\}\),即对所有样本\(x\),都有\(\frac{f(x,\theta_1)}{f(x,\theta_0)} = c\),也就是\(f(x,\theta_1) = c f(x,\theta_0)\)对所有\(x\)成立。
  5. 由于\(f(x,\theta_0)\)\(f(x,\theta_1)\)均为概率密度/质量函数,在全样本空间的积分均为1:

    \[\int_{\mathcal{X}} f(x,\theta_1) d\mu(x) = 1, \quad \int_{\mathcal{X}} f(x,\theta_0) d\mu(x) = 1 \]

    \(f(x,\theta_1)=c f(x,\theta_0)\)代入第一个积分,得\(c \cdot 1 = 1\),因此\(c=1\),即\(f(x,\theta_1) = f(x,\theta_0)\)对所有\(x\)成立。
  6. 这意味着原假设与备择假设对应的分布完全相同,即\(\mu\{x: f(x,\theta_0) \neq f(x,\theta_1)\} = 0\),与前提条件矛盾。因此假设不成立,必有\(E_{\theta_1}[\phi(X)] > \alpha\),严格无偏性得证。

定理的核心意义

  1. 性质保障:证明了N-P引理给出的最优检验,天然满足无偏性这一有效检验的基本要求,不会出现“检验在备择假设下的功效还不如错误拒绝概率”的无效情况;
  2. 区分能力验证:只要原假设与备择假设的分布存在差异,最优检验的功效就严格大于\(\alpha\),说明检验具备对两个假设的区分能力;
  3. 理论延伸:为后续复合假设的检验理论奠定了基础——当复合假设无法找到全局一致最优检验(UMPT)时,我们会在无偏检验类中寻找最优检验,即一致最优无偏检验(UMPUT),这是解决多参数、双边检验问题的核心框架。

三、核心内容系统归纳表

内容模块 核心结论 关键依据 核心应用价值
推论1 任意统计量的阈值型检验,均可通过调整临界值\(c\)和随机化概率\(\gamma\),精准控制第一类错误概率为\(\alpha\) 随机变量分布函数的分位数性质,复用N-P引理存在性证明 为所有经典阈值型检验(t检验、卡方检验等)的显著性水平设定提供理论依据
推论2 最优似然比检验可完全基于充分统计量构造,无需使用原始样本,且不损失样本信息 因子分解定理,似然比可化简为充分统计量的函数 实现检验的降维计算,极大简化高维样本的检验构造,是指数族分布检验的核心基础
推论3 若似然比是统计量\(T(x)\)的单调函数,最优似然比检验等价于基于\(T(x)\)的阈值型检验 单调函数的保序性,N-P引理拒绝域的等价转换 为单调似然比分布族的单边复合假设UMPT构造提供直接方法,是日常应用检验的核心理论支撑
无偏性定理 N-P引理给出的最优检验一定是无偏检验;若原假设与备择假设分布存在差异,检验功效严格大于\(\alpha\) MPT的定义、N-P引理的唯一性结论、反证法 保障最优检验的有效性,为复合假设的无偏检验理论奠定基础

N-P基本引理应用示例(泊松分布检验)完整讲解

本示例是Neyman-Pearson基本引理从简单假设最优检验(MPT) 推广到复合假设一致最优检验(UMPT) 的经典案例,完整展示了N-P引理的落地方法,以及单调似然比分布族的核心性质。我们将分步骤拆解解题逻辑、原理依据与拓展意义。


一、问题前置背景与核心定义

1.1 泊松分布基础

设随机变量\(X \sim P(\lambda)\)(参数为\(\lambda\)的泊松分布),其概率质量函数为:

\[P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}, \quad x=0,1,2,\dots \]

核心性质:

  • 期望\(E(X)=\lambda\),方差\(D(X)=\lambda\)
  • 可加性:若\(X_1,\dots,X_n\)独立同分布,\(X_i \sim P(\lambda)\),则\(T=\sum_{i=1}^n X_i \sim P(n\lambda)\)

1.2 检验问题设定

\(X_1,\dots,X_n\)独立同分布,\(X_i \sim P(\lambda)\),需解决两个检验问题:
(i) 简单假设检验\(H_0: \lambda = \lambda_0 \longleftrightarrow H_1: \lambda = \lambda_1 \ (\lambda_1 > \lambda_0)\),求水平\(\alpha\)的最优势检验(MPT);
(ii) 单边复合假设检验\(H_0: \lambda = \lambda_0 \longleftrightarrow H_1: \lambda > \lambda_0\),求水平\(\alpha\)的一致最优检验(UMPT)。


二、问题(i):简单假设的MPT求解(完整步骤)

步骤1:写出样本的联合似然函数

\(n\)个独立泊松样本的联合概率质量函数为:

\[f(x,\lambda) = \prod_{i=1}^n \frac{e^{-\lambda} \lambda^{x_i}}{x_i!} = \frac{e^{-n\lambda} \cdot \lambda^{\sum_{i=1}^n x_i}}{\prod_{i=1}^n x_i!} \]

其中\(\prod_{i=1}^n x_i!\)是与参数\(\lambda\)无关的常数项,在似然比计算中会直接约去。

步骤2:计算似然比统计量

根据N-P引理,最优检验的核心是似然比(备择假设与原假设的联合似然比值):

\[\lambda(x) = \frac{f(x,\lambda_1)}{f(x,\lambda_0)} \]

将联合似然代入,约去公共项\(\prod_{i=1}^n x_i!\),化简得:

\[\lambda(x) = \frac{e^{-n\lambda_1} \cdot \lambda_1^{\sum_{i=1}^n x_i}}{e^{-n\lambda_0} \cdot \lambda_0^{\sum_{i=1}^n x_i}} = e^{-n(\lambda_1-\lambda_0)} \cdot \left( \frac{\lambda_1}{\lambda_0} \right)^{\sum_{i=1}^n x_i} \]

步骤3:分析似然比的单调性,转化拒绝域

已知\(\lambda_1 > \lambda_0\),因此:

  1. \(e^{-n(\lambda_1-\lambda_0)}\)是与样本无关的正的常数;
  2. \(\frac{\lambda_1}{\lambda_0} > 1\),因此\(\left( \frac{\lambda_1}{\lambda_0} \right)^T\)是关于\(T=\sum_{i=1}^n x_i\)严格增函数

综上,似然比\(\lambda(x)\)是统计量\(T=\sum_{i=1}^n X_i\)的严格增函数。根据N-P引理推论3(单调似然比的检验简化),似然比拒绝域\(\lambda(x) > c\)可等价转化为:

\[R^+ = \{x: \lambda(x) > c\} = \{x: T(x) > k\} \]

其中\(k\)为临界值,由显著性水平\(\alpha\)确定。

直观解释:泊松分布的均值为\(\lambda\)\(\lambda\)越大,样本和\(T=\sum X_i\)的取值应越大。因此\(T\)越大,样本越符合备择假设\(H_1\)的特征,应拒绝原假设\(H_0\),与似然比的单调性完全一致。

步骤4:确定检验统计量在原假设下的分布

根据泊松分布的可加性,在\(H_0: \lambda=\lambda_0\)成立时,\(T=\sum_{i=1}^n X_i \sim P(n\lambda_0)\),即参数为\(n\lambda_0\)的泊松分布。

步骤5:求解临界值\(k\)与随机化概率\(\gamma\)

N-P引理要求检验满足水平约束:

\[E_{\lambda_0}[\phi(X)] = P_{\lambda_0}(T > k) + \gamma P_{\lambda_0}(T = k) = \alpha \]

其中\(0<\alpha<1\)\(0 \leq \gamma \leq 1\)

\(H_0\)\(T\)的分布函数为\(F_0(u) = P_{\lambda_0}(T \leq u)\),则:

  • \(P_{\lambda_0}(T > k) = 1 - F_0(k)\)
  • \(P_{\lambda_0}(T = k) = F_0(k) - F_0(k-0)\)(离散型分布在\(k\)点的跳跃幅度)

代入水平约束,整理得:

\[1 - F_0(k) + \gamma \left[ F_0(k) - F_0(k-0) \right] = \alpha \]

求解规则:

  1. \(k_0\)\(F_0(u)\)\(1-\alpha\)分位数\(u_{1-\alpha}\),即满足\(F_0(u_{1-\alpha}) \geq 1-\alpha\)的最小非负整数;
  2. 代入求解随机化概率\(\gamma_0\)

    \[\gamma_0 = \frac{F_0(u_{1-\alpha}) - (1-\alpha)}{F_0(u_{1-\alpha}) - F_0(u_{1-\alpha}-0)} \]

    可验证\(0 \leq \gamma_0 \leq 1\),恰好满足水平约束。

补充说明:泊松分布是离散型分布,\(P(T=k) > 0\),无法通过非随机化检验精准控制第一类错误为\(\alpha\),因此需要引入随机化概率\(\gamma\):当\(T=k_0\)时,以概率\(\gamma_0\)拒绝\(H_0\),以概率\(1-\gamma_0\)接受\(H_0\)。若为连续型分布,\(P(T=k)=0\),无需随机化,直接取\(k\)使\(P(T>k)=\alpha\)即可。

步骤6:写出最终的MPT检验函数

\[\phi(x) = \begin{cases} 1, & T(x) > k_0 \\ \gamma_0, & T(x) = k_0 \\ 0, & T(x) < k_0 \end{cases} \]

其中\(T(x)=\sum_{i=1}^n x_i\)\(k_0\)\(\gamma_0\)由上述步骤确定。


三、问题(ii):单边复合假设的UMPT证明

3.1 UMPT的核心定义

对于复合假设检验\(H_0: \theta \in \Theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\),若检验\(\phi(x)\)满足:

  1. 水平约束:对所有\(\theta \in \Theta_0\)\(E_\theta[\phi(X)] \leq \alpha\)
  2. 一致最优性:对任意水平\(\alpha\)的检验\(\tilde{\phi}(x)\),以及所有\(\theta \in \Theta_1\),都有\(E_\theta[\phi(X)] \geq E_\theta[\tilde{\phi}(X)]\)

则称\(\phi(x)\)为该检验问题水平\(\alpha\)一致最优检验(UMPT)

3.2 完整证明过程

我们要证明:问题(i)中得到的MPT检验\(\phi(x)\),就是问题(ii)的UMPT,核心逻辑如下:

  1. 检验形式与备择参数无关
    问题(i)的检验\(\phi(x)\),其临界值\(k_0\)和随机化概率\(\gamma_0\)仅由原假设的\(\lambda_0\)和显著性水平\(\alpha\)决定,与备择假设的\(\lambda_1\)无关
    只要满足\(\lambda_1 > \lambda_0\),似然比\(\lambda(x)\)就是\(T=\sum X_i\)的严格增函数,拒绝域始终为\(T>k_0\),不会随\(\lambda_1\)的取值变化。

  2. 对任意备择参数都是MPT
    对备择假设中任意的\(\lambda_1 > \lambda_0\)\(\phi(x)\)都是简单假设检验\(H_0:\lambda=\lambda_0 \longleftrightarrow H_1:\lambda=\lambda_1\)的水平\(\alpha\)的MPT。
    即对任意水平\(\alpha\)的检验\(\tilde{\phi}(x)\),都有\(E_{\lambda_1}[\phi(X)] \geq E_{\lambda_1}[\tilde{\phi}(X)]\)

  3. 满足UMPT的定义
    上述不等式对所有\(\lambda_1 > \lambda_0\)(即备择假设的所有参数)都成立,因此\(\phi(x)\)在整个备择假设空间上,功效都是所有水平\(\alpha\)检验中最大的。

综上,\(\phi(x)\)就是单边复合假设检验\(H_0:\lambda=\lambda_0 \longleftrightarrow H_1:\lambda>\lambda_0\)水平\(\alpha\)的UMPT。


四、示例的核心意义与拓展

  1. N-P引理的推广价值:该示例证明了N-P引理不仅能解决简单假设的MPT问题,还能通过单调似然比性质,推广到单边复合假设的UMPT求解,是经典参数假设检验的核心理论支撑。
  2. 单调似然比分布族的特性:泊松分布是典型的单调似然比分布族,这类分布族的单边复合假设一定存在UMPT,且形式与简单假设的MPT完全一致。正态分布、二项分布、指数分布等常用分布均属于该类分布族。
  3. 检验的直观性:最优检验完全基于充分统计量\(T=\sum X_i\)构造,既不损失样本信息,又极大简化了计算,符合我们对泊松分布参数检验的直观认知。

五、核心内容归纳表

检验问题 核心统计量 最优检验形式 关键依据
简单假设\(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda=\lambda_1(\lambda_1>\lambda_0)\) \(T=\sum_{i=1}^n X_i \sim P(n\lambda_0)\)\(H_0\)下) $$\phi(x) = \begin{cases} 1, & T>k_0 \ \gamma_0, & T=k_0 \ 0, & T<k_0 \end{cases}$$ N-P基本引理、似然比的单调性、泊松分布可加性
单边复合假设\(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda>\lambda_0\) \(T=\sum_{i=1}^n X_i\) 与上述简单假设的检验形式完全一致 检验形式与备择参数无关,对所有\(\lambda>\lambda_0\)均为MPT,满足UMPT定义

均匀分布下N-P基本引理应用示例 完整讲解

本示例是Neyman-Pearson基本引理在支撑集依赖参数的连续型分布中的经典应用,核心展示了似然比出现离散取值、无穷大时的MPT构造方法,我们将从基础原理、分步求解、直观解读三个维度完整拆解。


一、问题与前置基础

1.1 检验问题设定

\(X_1,X_2,\dots,X_n\)独立同分布,\(X_1 \sim R(0,\theta)\)(区间\((0,\theta)\)上的均匀分布),求解简单假设检验问题:

\[H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 \quad (\theta_0 < \theta_1) \]

的水平为\(\alpha\)\(0<\alpha<1\))的最优势检验(MPT)。

1.2 前置核心知识

  1. 均匀分布的密度函数:单个随机变量\(X \sim R(0,\theta)\)的概率密度为:

    \[f(x,\theta) = \begin{cases} \displaystyle \frac{1}{\theta}, & 0 < x < \theta \\ 0, & \text{其他} \end{cases}\]

  2. 样本联合密度与次序统计量\(n\)个独立样本的联合密度需满足所有样本都落在\((0,\theta)\)内,等价于样本最小值\(x_{(1)}>0\)且样本最大值\(x_{(n)}<\theta\),因此联合密度可通过指示函数\(I\{\cdot\}\)(条件成立时取1,不成立取0)简化为:

    \[f(x,\theta) = \frac{1}{\theta^n} I\{x_{(1)}>0\} I\{x_{(n)}<\theta\} \]

    其中\(x_{(n)} = \max\{X_1,X_2,\dots,X_n\}\)是样本最大值,也是\(\theta\)的充分统计量。
  3. 均匀分布的核心特性:在\(H_0: \theta=\theta_0\)成立时,样本最大值\(x_{(n)}\)不可能超过\(\theta_0\),即\(P_{\theta_0}(x_{(n)} > \theta_0) = 0\);而\(\theta\)越大,样本最大值的取值范围越大,这是检验的直观依据。

二、MPT的完整求解步骤

步骤1:计算似然比统计量

根据N-P引理,最优检验的核心是似然比\(\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)}\),将联合密度代入,约去公共项\(I\{x_{(1)}>0\}\),得:

\[\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot \frac{I\{0 < x_{(n)} < \theta_1\}}{I\{0 < x_{(n)} < \theta_0\}} \]

由于\(\theta_0 < \theta_1\),似然比的取值由样本最大值\(x_{(n)}\)的范围分为三段,仅取3个离散值:

  1. \(0 \leq x_{(n)} \leq \theta_0\):分子分母的指示函数均为1,因此\(\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n\),记该常数为\(\tilde{\theta}\),显然\(0 < \tilde{\theta} < 1\)
  2. \(\theta_0 < x_{(n)} \leq \theta_1\):分母指示函数\(I\{x_{(n)} < \theta_0\}=0\),分子指示函数\(I\{x_{(n)} < \theta_1\}=1\),因此\(\lambda(x) = +\infty\)
  3. \(x_{(n)} > \theta_1\):分子分母的指示函数均为0,约定\(\lambda(x)=0\)

关键特性:尽管\(X\)是连续型分布,但似然比\(\lambda(X)\)仅取\(0、\tilde{\theta}、+\infty\)三个离散值,这是均匀分布支撑集依赖参数的核心特征。

步骤2:确定临界值\(c\)的唯一可行取值

根据N-P引理,检验的水平约束为:

\[E_{\theta_0}[\phi(X)] = P_{\theta_0}(\lambda(X) > c) + \gamma P_{\theta_0}(\lambda(X) = c) = \alpha \]

我们通过分类讨论证明:仅当\(c=\tilde{\theta}\)时,才能满足\(0<\alpha<1\)的水平要求。

情况1:\(c > \tilde{\theta}\)

此时\(\lambda(X) > c\)的唯一可能是\(\lambda(X)=+\infty\),对应\(x_{(n)} \in (\theta_0,\theta_1)\)
但在\(H_0\)成立时,\(x_{(n)} \leq \theta_0\)恒成立,因此\(P_{\theta_0}(\lambda(X) > c) = 0\)
同时\(\lambda(X)=c\)无对应取值,\(P_{\theta_0}(\lambda(X)=c)=0\),因此\(E_{\theta_0}[\phi(X)]=0\),无法等于\(\alpha\),该取值不可行。

情况2:\(c < \tilde{\theta}\)

此时\(\lambda(X) > c\)包含\(\lambda(X)=\tilde{\theta}\)\(\lambda(X)=+\infty\),对应\(x_{(n)} \in [0,\theta_1]\)
\(H_0\)成立时,\(x_{(n)} \leq \theta_0 < \theta_1\)恒成立,因此\(P_{\theta_0}(\lambda(X) > c) = 1\)\(E_{\theta_0}[\phi(X)]=1\),也无法等于\(\alpha\),该取值不可行。

情况3:\(c = \tilde{\theta}\)(唯一可行解)

此时:

  • \(\lambda(X) > c\):仅对应\(\lambda(X)=+\infty\),即\(x_{(n)} \in (\theta_0,\theta_1)\)\(H_0\)下概率为0;
  • \(\lambda(X) = c\):对应\(\lambda(X)=\tilde{\theta}\),即\(x_{(n)} \in [0,\theta_0]\)\(H_0\)下概率为1;
  • \(\lambda(X) < c\):仅对应\(\lambda(X)=0\)\(H_0\)下概率为0。

步骤3:求解随机化概率\(\gamma\)

\(c=\tilde{\theta}\)代入水平约束:

\[E_{\theta_0}[\phi(X)] = 0 + \gamma \cdot 1 = \alpha \]

直接解得\(\gamma = \alpha\),恰好满足\(0 \leq \gamma \leq 1\)的要求。

步骤4:写出最终的MPT检验函数

结合N-P引理的检验形式,最终的最优势检验为:

\[\phi(x) = \begin{cases} 1, & \lambda(x) > \tilde{\theta} \quad (\text{即 } \theta_0 < x_{(n)} \leq \theta_1) \\ \alpha, & \lambda(x) = \tilde{\theta} \quad (\text{即 } 0 \leq x_{(n)} \leq \theta_0) \\ 0, & \lambda(x) < \tilde{\theta} \quad (\text{即 } x_{(n)} > \theta_1) \end{cases} \]


三、检验的直观解读与核心特性

3.1 直观逻辑

  1. \(x_{(n)} > \theta_0\):在原假设\(H_0\)下,样本最大值不可能超过\(\theta_0\),该样本在\(H_0\)下是不可能事件,因此直接拒绝\(H_0\)\(\phi(x)=1\)),完全符合逻辑;
  2. \(0 \leq x_{(n)} \leq \theta_0\):样本在\(H_0\)\(H_1\)下都有可能出现,无法完全区分,因此通过随机化检验,以概率\(\alpha\)拒绝\(H_0\),精准控制第一类错误概率恰好为\(\alpha\)
  3. \(x_{(n)} > \theta_1\):样本在备择假设\(H_1\)下也是不可能事件,因此直接接受\(H_0\)\(\phi(x)=0\))。

3.2 核心特性总结

  1. 充分统计量的应用:检验仅依赖样本最大值\(x_{(n)}\)\(\theta\)的充分统计量),符合N-P引理推论2,不损失任何样本信息;
  2. 离散似然比的处理:针对支撑集依赖参数的分布,似然比出现离散取值和无穷大时,临界值必须取似然比的非零有限值,通过随机化概率控制检验水平;
  3. 最优性保障:该检验严格满足N-P引理的构造要求,是该简单假设检验问题水平\(\alpha\)下的唯一MPT。

四、与泊松分布示例的核心差异对比表

对比维度 泊松分布示例 均匀分布本示例
分布特性 支撑集不依赖参数,似然比为连续型统计量的单调函数 支撑集依赖参数,似然比仅取3个离散值,包含无穷大
临界值确定 取似然比统计量的\(1-\alpha\)分位数 仅能取似然比的非零有限值\(\tilde{\theta}\),无其他可行解
随机化的作用 弥补离散分布的跳跃,精准控制水平 唯一实现水平\(\alpha\)的方式,无随机化则检验水平只能为0或1
拒绝域核心逻辑 样本和越大,越拒绝原假设 样本最大值超过\(\theta_0\),直接拒绝原假设

正态分布下N-P基本引理应用示例 完整讲解

本示例是Neyman-Pearson基本引理最经典的落地应用,完整推导了方差已知的正态总体均值单边检验的理论依据,证明了我们日常使用的Z检验就是该场景下的一致最优检验(UMPT),同时总结了从简单假设MPT推广到复合假设UMPT的通用规则。


一、问题与前置基础

1.1 检验问题设定

\(X_1,X_2,\dots,X_n\)独立同分布,\(X_1 \sim N(\mu,\sigma_0^2)\),其中\(\sigma_0^2\)已知,需解决三类单边假设检验问题:
(i) 简单假设检验\(H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu = \mu_1 \ (\mu_1 > \mu_0)\),求水平\(\alpha\)的最优势检验(MPT);
(ii) 单边复合假设检验(简单原假设)\(H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu > \mu_0\),求水平\(\alpha\)的UMPT;
(iii) 单边复合假设检验(复合原假设)\(H_0: \mu \leq \mu_0 \longleftrightarrow H_1: \mu > \mu_0\),求水平\(\alpha\)的UMPT。

需完成四个核心任务:

  1. 求解(i)的MPT;
  2. 推导(i)的功效函数\(\beta_\phi(\mu)\),证明其为\(\mu\)的增函数;
  3. 证明(i)的MPT是(ii)的UMPT;
  4. 证明(ii)的UMPT是(iii)的UMPT。

1.2 前置核心知识

  1. 正态分布样本联合密度\(n\)个独立正态样本的联合概率密度为:

    \[f(x,\mu) = \left( \frac{1}{\sqrt{2\pi}\sigma_0} \right)^n \exp\left\{ -\frac{1}{2\sigma_0^2} \sum_{i=1}^n (x_i - \mu)^2 \right\} \]

  2. 充分统计量:样本均值\(\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\)\(\mu\)的充分统计量,且\(\bar{X} \sim N\left(\mu, \frac{\sigma_0^2}{n}\right)\)
  3. 标准正态分布分位数:记\(\Phi(\cdot)\)为标准正态分布的分布函数,\(z_{1-\alpha}\)为其\(1-\alpha\)分位数,满足\(\Phi(z_{1-\alpha})=1-\alpha\),即\(P(Z > z_{1-\alpha})=\alpha\)\(Z \sim N(0,1)\));
  4. 分布函数性质\(\Phi(\cdot)\)是严格增函数,且满足\(1-\Phi(x)=\Phi(-x)\)

二、分步求解与证明

任务1:求解问题(i)的MPT

步骤1:计算似然比统计量

根据N-P引理,最优检验的核心是似然比\(\lambda(x) = \frac{f(x,\mu_1)}{f(x,\mu_0)}\),将联合密度代入,约去公共常数项\(\left( \frac{1}{\sqrt{2\pi}\sigma_0} \right)^n\),得:

\[\lambda(x) = \frac{\exp\left\{ -\frac{1}{2\sigma_0^2} \sum_{i=1}^n (x_i - \mu_1)^2 \right\}}{\exp\left\{ -\frac{1}{2\sigma_0^2} \sum_{i=1}^n (x_i - \mu_0)^2 \right\}} \]

展开指数部分的平方项并化简:

\[\sum_{i=1}^n (x_i - \mu_1)^2 - \sum_{i=1}^n (x_i - \mu_0)^2 = -2(\mu_1 - \mu_0)\sum_{i=1}^n x_i + n(\mu_0^2 - \mu_1^2) \]

代入似然比,最终化简为:

\[\lambda(x) = \exp\left\{ \frac{1}{\sigma_0^2} \left[ (\mu_1 - \mu_0)\sum_{i=1}^n x_i + n\left( \frac{\mu_0^2}{2} - \frac{\mu_1^2}{2} \right) \right] \right\} \]

步骤2:分析似然比的单调性,转化拒绝域

已知\(\mu_1 > \mu_0\),因此\(\frac{\mu_1 - \mu_0}{\sigma_0^2} > 0\),似然比\(\lambda(x)\)\(\sum_{i=1}^n x_i = n\bar{X}\)严格增函数,即\(\bar{X}\)越大,\(\lambda(x)\)越大。

根据N-P引理推论3,似然比拒绝域\(\lambda(x) > c\)可等价转化为:

\[R^+ = \{x: \lambda(x) > c\} = \{x: \bar{X} > k\} \]

其中\(k\)为临界值,由显著性水平\(\alpha\)确定。

步骤3:确定临界值\(k\)

由于\(\bar{X}\)是连续型随机变量,\(P_{\mu_0}(\bar{X}=k)=0\),无需随机化,检验函数为非随机化形式:

\[\phi(x) = \begin{cases} 1, & \bar{X} > k \\ 0, & \bar{X} < k \end{cases} \]

根据水平约束\(E_{\mu_0}[\phi(X)] = \alpha\),结合\(\bar{X}\)\(H_0\)下的分布\(\bar{X} \sim N\left(\mu_0, \frac{\sigma_0^2}{n}\right)\),对\(\bar{X}\)标准化:

\[P_{\mu_0}(\bar{X} > k) = P_{\mu_0}\left( \frac{\sqrt{n}(\bar{X} - \mu_0)}{\sigma_0} > \frac{\sqrt{n}(k - \mu_0)}{\sigma_0} \right) = \alpha \]

由标准正态分布分位数定义,\(\frac{\sqrt{n}(k - \mu_0)}{\sigma_0} = z_{1-\alpha}\),解得临界值:

\[k_0 = \mu_0 + \frac{\sigma_0}{\sqrt{n}} z_{1-\alpha} \]

步骤4:写出最终的MPT

\[\phi(x) = \begin{cases} 1, & \bar{X} > k_0 \\ 0, & \bar{X} < k_0 \end{cases}, \quad k_0 = \mu_0 + \frac{\sigma_0}{\sqrt{n}} z_{1-\alpha} \]

直观对应:该检验就是我们日常使用的单边Z检验。例如\(\alpha=0.05\)时,\(z_{0.95}=1.65\)\(k_0 = \mu_0 + 1.65\frac{\sigma_0}{\sqrt{n}}\)\(\alpha=0.01\)时,\(z_{0.99}=2.33\),临界值随显著性水平减小而增大,符合假设检验的直观逻辑。


任务2:推导功效函数\(\beta_\phi(\mu)\),证明其为\(\mu\)的增函数

步骤1:推导功效函数表达式

功效函数的定义为:检验在参数\(\mu\)下拒绝原假设的概率,即

\[\beta_\phi(\mu) = E_\mu[\phi(X)] = P_\mu(\bar{X} > k_0), \quad \forall \mu \]

结合\(\bar{X} \sim N\left(\mu, \frac{\sigma_0^2}{n}\right)\),标准化后展开:

\[\begin{align*} \beta_\phi(\mu) &= P_\mu\left( \frac{\sqrt{n}(\bar{X} - \mu)}{\sigma_0} > \frac{\sqrt{n}(k_0 - \mu)}{\sigma_0} \right) \\ &= 1 - \Phi\left( \frac{\sqrt{n}(k_0 - \mu)}{\sigma_0} \right) \end{align*} \]

\(k_0 = \mu_0 + \frac{\sigma_0}{\sqrt{n}} z_{1-\alpha}\)代入,化简自变量:

\[\frac{\sqrt{n}(k_0 - \mu)}{\sigma_0} = z_{1-\alpha} + \frac{\sqrt{n}(\mu_0 - \mu)}{\sigma_0} \]

结合\(1-\Phi(x)=\Phi(-x)\),最终得到功效函数的简洁形式:

\[\beta_\phi(\mu) = \Phi\left( \frac{\sqrt{n}(\mu - \mu_0)}{\sigma_0} - z_{1-\alpha} \right) \]

步骤2:证明\(\beta_\phi(\mu)\)\(\mu\)的严格增函数

  • 标准正态分布的分布函数\(\Phi(\cdot)\)严格增函数
  • 自变量\(\frac{\sqrt{n}(\mu - \mu_0)}{\sigma_0} - z_{1-\alpha}\)是关于\(\mu\)严格增函数\(\mu\)增大,自变量单调递增);
  • 严格增函数的复合函数仍为严格增函数,因此\(\beta_\phi(\mu)\)\(\mu\)的严格增函数。

步骤3:核心性质与直观解读

由单调性可直接得到检验的核心性质:

\[\beta_\phi(\mu) = \begin{cases} < \alpha, & \mu < \mu_0 \\ = \alpha, & \mu = \mu_0 \\ > \alpha, & \mu > \mu_0 \end{cases} \]

  1. 无偏性:在备择假设\(\mu>\mu_0\)下,检验功效严格大于显著性水平\(\alpha\),符合无偏检验的要求;
  2. 第二类错误:第二类错误概率\(\Pi(\mu) = 1 - \beta_\phi(\mu)\),在\(\mu>\mu_0\)时,\(\Pi(\mu) < 1-\alpha\)
  3. 样本量影响:样本量\(n\)越大,功效函数的自变量越大,\(\beta_\phi(\mu)\)越接近1,第二类错误越接近0,符合“样本量越大,检验能力越强”的直观逻辑。

任务3:证明(i)的MPT是(ii)的UMPT

核心依据:UMPT的定义

对于检验问题(ii) \(H_0: \mu = \mu_0 \longleftrightarrow H_1: \mu > \mu_0\),若检验\(\phi(x)\)满足:

  1. 水平约束:\(E_{\mu_0}[\phi(X)] \leq \alpha\)
  2. 一致最优性:对任意水平\(\alpha\)的检验\(\tilde{\phi}(x)\),以及所有\(\mu > \mu_0\),都有\(E_\mu[\phi(X)] \geq E_\mu[\tilde{\phi}(X)]\)

\(\phi(x)\)为该检验问题的UMPT。

完整证明

  1. 检验形式与备择参数无关:我们得到的MPT\(\phi(x)\),其临界值\(k_0\)仅由\(\mu_0、\sigma_0、n、\alpha\)决定,与备择假设的\(\mu_1\)无关。无论\(\mu_1\)取何值(只要\(\mu_1 > \mu_0\)),该检验都是对应简单假设的MPT。
  2. 对所有备择参数均为最优:对任意\(\mu > \mu_0\)\(\phi(x)\)都是简单假设\(H_0:\mu=\mu_0 \longleftrightarrow H_1:\mu=\mu\)的水平\(\alpha\)的MPT。因此对任意水平\(\alpha\)的检验\(\tilde{\phi}(x)\),都有\(E_\mu[\phi(X)] \geq E_\mu[\tilde{\phi}(X)]\)
  3. 满足UMPT定义:上述不等式对所有\(\mu > \mu_0\)成立,因此\(\phi(x)\)是检验问题(ii)的UMPT。

任务4:证明(ii)的UMPT是(iii)的UMPT

核心依据:复合原假设的UMPT定义

对于检验问题(iii) \(H_0: \mu \leq \mu_0 \longleftrightarrow H_1: \mu > \mu_0\),若检验\(\phi(x)\)满足:

  1. 水平约束:对所有\(\mu \leq \mu_0\)\(E_\mu[\phi(X)] \leq \alpha\)
  2. 一致最优性:对任意满足水平约束的检验\(\tilde{\phi}(x)\),以及所有\(\mu > \mu_0\),都有\(E_\mu[\phi(X)] \geq E_\mu[\tilde{\phi}(X)]\)

\(\phi(x)\)为该检验问题的UMPT。

完整证明

  1. 满足水平约束:我们已证明\(\beta_\phi(\mu)\)\(\mu\)的严格增函数,因此在原假设空间\(\mu \leq \mu_0\)上,\(\beta_\phi(\mu)\)的最大值在\(\mu=\mu_0\)处取得,且\(\beta_\phi(\mu_0)=\alpha\)。因此对所有\(\mu \leq \mu_0\),都有\(E_\mu[\phi(X)] = \beta_\phi(\mu) \leq \alpha\),满足复合原假设的水平约束。
  2. 满足一致最优性:任意满足水平约束的检验\(\tilde{\phi}(x)\),对所有\(\mu \leq \mu_0\)都有\(E_\mu[\tilde{\phi}(X)] \leq \alpha\),自然满足\(E_{\mu_0}[\tilde{\phi}(X)] \leq \alpha\),即\(\tilde{\phi}(x)\)是检验问题(ii)的水平\(\alpha\)检验。
    \(\phi(x)\)是(ii)的UMPT,因此对所有\(\mu > \mu_0\),都有\(E_\mu[\phi(X)] \geq E_\mu[\tilde{\phi}(X)]\),满足最优性。

综上,\(\phi(x)\)是检验问题(iii)的UMPT。

补充拓展:对于左侧单边检验\(H_0:\mu=\mu_0 \longleftrightarrow H_1:\mu=\mu_1(\mu_1<\mu_0)\),似然比是\(\bar{X}\)的严格减函数,拒绝域为\(\bar{X} < k_0 = \mu_0 - \frac{\sigma_0}{\sqrt{n}}z_{1-\alpha}\),同理可证明其为对应复合假设的UMPT,即左侧单边Z检验。


三、复合假设UMPT的通用推广引理

从正态分布、泊松分布的示例中,可总结出从简单假设MPT推广到复合假设UMPT的通用规则,即引理6.2.1:

引理6.2.1 核心内容

针对三类假设检验问题:
(i) 简单假设:\(H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 \ (\theta_0 \in \Theta_0, \theta_1 \in \Theta_1)\)
(ii) 复合备择假设:\(H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\)
(iii) 复合原假设+复合备择假设:\(H_0: \theta \in \Theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\)

有两个核心结论:

  1. 从MPT到简单原假设的UMPT:若\(\phi(x)\)是(i)的MPT,且\(\phi(x)\)的形式与备择参数\(\theta_1\)无关,则\(\phi(x)\)是(ii)的UMPT。
  2. 从简单原假设到复合原假设的UMPT:若\(\phi(x)\)是(ii)的UMPT,且同时是(iii)的水平\(\alpha\)检验(即对所有\(\theta \in \Theta_0\)\(E_\theta[\phi(X)] \leq \alpha\)),则\(\phi(x)\)是(iii)的UMPT。

引理的核心价值

该引理是解决复合假设检验问题的核心工具,将N-P引理的适用范围从简单假设拓展到了一大类复合假设,证明了单调似然比分布族的单边检验一定存在UMPT,为经典参数假设检验提供了统一的理论框架。


四、核心内容归纳表

检验问题 最优检验形式 核心依据 实际对应检验
(i) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu=\mu_1(\mu_1>\mu_0)\) $$\phi(x)=\begin{cases}1, & \bar{X} > \mu_0 + \frac{\sigma_0}{\sqrt{n}}z_{1-\alpha} \ 0, & \bar{X} < \mu_0 + \frac{\sigma_0}{\sqrt{n}}z_{1-\alpha}\end{cases}$$ N-P基本引理、似然比的单调性 单边Z检验(简单假设)
(ii) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu>\mu_0\) 与(i)的检验形式完全一致 引理6.2.1结论1,检验与备择参数无关 单边Z检验(简单原假设)
(iii) \(H_0:\mu\leq\mu_0 \leftrightarrow H_1:\mu>\mu_0\) 与(i)的检验形式完全一致 引理6.2.1结论2,功效函数的单调性 单边Z检验(复合原假设,日常最常用)
功效函数 \(\beta_\phi(\mu) = \Phi\left( \frac{\sqrt{n}(\mu - \mu_0)}{\sigma_0} - z_{1-\alpha} \right)\) 正态分布的分布函数性质 刻画检验的能力,随\(\mu\)增大、\(n\)增大而递增

知识大总结

Neyman-Pearson基本引理全体系知识点详细汇总表

以下表格完整覆盖N-P引理的基础概念、核心定理、推论、性质、经典应用与推广规则,实现全知识点结构化梳理。


表1 核心基础概念汇总

概念名称 数学定义与符号 核心含义
简单假设检验 \(H_0: \theta=\theta_0 \longleftrightarrow H_1: \theta=\theta_1\) 原假设与备择假设均为单点参数,完全确定样本分布,是N-P引理的适用基础场景
复合假设检验 单边:\(H_0: \theta \in \Theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\)\(\Theta_0/\Theta_1\)为区间) 原/备择假设包含多个参数值,是N-P引理的推广应用场景
检验函数\(\phi(x)\) 取值于\([0,1]\)的函数:
\(\phi(x)=1\):拒绝\(H_0\)\(\phi(x)=0\):接受\(H_0\)\(\phi(x)=\gamma\):以概率\(\gamma\)随机拒绝\(H_0\)
刻画观测到样本\(x\)时拒绝原假设的概率,分为非随机化检验(仅取0/1)和随机化检验(取0/1/\(\gamma\)
第一类错误(弃真) \(P(\text{拒绝}H_0|H_0\text{为真}) = E_{\theta_0}[\phi(X)]\) 原假设为真时错误拒绝的概率,检验需满足\(E_{\theta_0}[\phi(X)] \leq \alpha\)\(\alpha\)为显著性水平)
第二类错误(取伪) \(P(\text{接受}H_0|H_1\text{为真}) = 1 - E_{\theta_1}[\phi(X)]\) 备择假设为真时错误接受的概率,其补为检验功效
功效函数\(\beta_\phi(\theta)\) \(\beta_\phi(\theta) = E_\theta[\phi(X)]\) 刻画参数为\(\theta\)时检验拒绝原假设的概率,是检验性能的核心评价指标
最优势检验(MPT) \(\tilde{\phi}(x) \in \Phi_\alpha = \{\phi: E_{\theta_0}[\phi(X)] \leq \alpha\}\),有\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)]\) 简单假设检验中,控制第一类错误≤α的前提下,功效最大的检验,是N-P引理的核心求解目标
一致最优检验(UMPT) 对所有\(\theta \in \Theta_1\)\(\phi(x)\)均为对应简单假设的MPT,且满足\(E_{\theta}[\phi(X)] \leq \alpha, \forall \theta \in \Theta_0\) 复合假设检验中,在整个备择假设空间上均保持最优的检验,是N-P引理的核心推广目标
似然比统计量\(\lambda(x)\) \(\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)}\)\(f(x,\theta)\)为样本联合密度/质量函数 样本在备择假设与原假设下的似然比值,是N-P引理构造最优检验的核心统计量
充分统计量\(T(X)\) 样本联合密度可分解为\(f(x,\theta)=g(T(x),\theta)h(x)\)\(h(x)\)\(\theta\)无关 包含样本中关于参数\(\theta\)的全部信息,可实现检验的降维构造

表2 Neyman-Pearson基本引理核心定理与证明

定理三大核心结论 核心内容 证明核心逻辑 关键要点
存在性 对任意\(0<\alpha<1\),必存在\(c \geq 0\)\(0 \leq \gamma \leq 1\),使检验函数
$$\phi(x) = \begin{cases}1, & \lambda(x) > c \ \gamma, & \lambda(x) = c \ 0, & \lambda(x) < c\end{cases}$$
满足\(E_{\theta_0}[\phi(X)] = \alpha\)
1. 展开检验的第一类错误概率:\(E_{\theta_0}[\phi(X)] = P_{\theta_0}(\lambda(X)>c) + \gamma P_{\theta_0}(\lambda(X)=c)\)
2. 取\(c\)\(\lambda(X)\)\(H_0\)下的\(1-\alpha\)分位数;
3. 连续点:\(\gamma\)任意;跳跃点:解出\(\gamma\)满足水平约束,验证\(0 \leq \gamma \leq 1\)
1. 连续型分布:\(\lambda(X)=c\)概率为0,无需随机化,检验退化为非随机化形式;
2. 离散型分布:必须通过随机化概率\(\gamma\)精准控制第一类错误为\(\alpha\)
最优性(充分性) 上述似然比检验\(\phi(x)\),必是水平\(\alpha\)的最优势检验(MPT) 1. 构造核心积分:\(\int_{\mathcal{X}} [\phi(x)-\tilde{\phi}(x)][f(x,\theta_1)-cf(x,\theta_0)]d\mu(x) \geq 0\)
2. 分区域分析被积函数符号:\(R^+\)\(R^-\)上被积函数均非负,积分≥0;
3. 转化为期望形式,证明\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)]\)
1. 核心依据:似然比的符号与\(f(x,\theta_1)-cf(x,\theta_0)\)完全一致;
2. 证明了似然比检验是所有水平α检验中功效最大的
唯一性(必要性) 1. 所有MPT在\(\lambda(x) \neq c\)的区域上,几乎处处等于上述似然比检验;
2. 若MPT的功效\(E_{\theta_1}[\phi^*(X)] < 1\),则其第一类错误概率必等于\(\alpha\)
1. 最优检验的功效必然相等,因此核心积分必须取等号;
2. 非负可测函数积分为0,当且仅当函数几乎处处为0,因此\(\phi^*(x)=\phi(x)\)\(R^+ \cup R^-\)上几乎处处成立;
3. 反证法证明\(c \neq 0\),因此必须满足\(E_{\theta_0}[\phi^*(X)] = \alpha\)
1. 唯一性仅在\(\lambda(x) \neq c\)的区域成立,\(\lambda(x)=c\)的区域可存在多个MPT;
2. 最优检验必然是精确水平α的,不会浪费显著性水平

表3 N-P引理三大核心推论详解

推论编号 核心结论 核心理论依据 核心应用价值
推论1 对任意统计量\(T=T(X)\),构造阈值型检验
$$\phi(x) = \begin{cases}1, & T(x) > c \ \gamma, & T(x) = c \ 0, & T(x) < c\end{cases}$$
必存在\(c,\gamma\)使\(E_{\theta_0}[\phi(X)] = \alpha\)
复用N-P引理存在性的证明框架,将似然比替换为任意统计量,利用分布函数的分位数性质求解\(c\)\(\gamma\) 为所有经典阈值型检验(t检验、卡方检验、F检验等)的显著性水平设定提供了理论依据
推论2 \(T=T(X)\)\(\theta\)的充分统计量,\(T \sim g(t,\theta)\),则最优似然比检验可完全基于\(T\)构造:
$$\phi(t) = \begin{cases}1, & \lambda(t) = \frac{g(t,\theta_1)}{g(t,\theta_0)} > c \ \gamma, & \lambda(t) = c \ 0, & \lambda(t) < c\end{cases}$$
因子分解定理:样本联合密度可分解为充分统计量的函数与无关项的乘积,似然比可完全化简为充分统计量的函数,不损失样本信息 1. 实现检验的降维计算,将高维样本的检验转化为低维充分统计量的检验;
2. 为指数族分布的检验构造奠定了核心基础
推论3 若似然比\(\lambda(x)\)是统计量\(T(x)\)的严格增函数\(\lambda(x)=h(T(x))\),则最优似然比检验等价于阈值型检验:
$$\phi(x) = \begin{cases}1, & T(x) > k \ \gamma, & T(x) = k \ 0, & T(x) < k\end{cases}$$
严格增函数的保序性:\(\lambda(x) > c \iff h(T(x)) > c \iff T(x) > h^{-1}(c)\),拒绝域完全等价 1. 为单调似然比分布族的单边复合假设UMPT构造提供了直接方法;
2. 将复杂的似然比计算简化为“统计量与临界值比较”的常用形式,是日常应用检验的核心理论支撑

表4 最优检验的无偏性定理

项目 详细内容
无偏检验定义 水平为\(\alpha\)的检验\(\phi(x)\),若对所有\(\theta \in \Theta_1\),满足\(E_{\theta}[\phi(X)] \geq \alpha\),则称为无偏检验
核心定理结论 1. N-P引理给出的最优检验(MPT)一定是无偏检验,即\(E_{\theta_1}[\phi(X)] \geq \alpha\)
2. 若\(\mu\{x:f(x,\theta_0) \neq f(x,\theta_1)\} > 0\)(原假设与备择假设分布存在差异),则\(E_{\theta_1}[\phi(X)] > \alpha\),检验严格无偏
证明核心逻辑 1. 构造平凡检验\(\tilde{\phi}(x) \equiv \alpha\),其属于水平\(\alpha\)的检验集合,功效为\(\alpha\)
2. 由MPT的最优性,\(E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\tilde{\phi}(X)] = \alpha\),无偏性得证;
3. 反证法:若\(E_{\theta_1}[\phi(X)] = \alpha\),则平凡检验也是MPT,结合唯一性结论可推出原假设与备择假设分布完全相同,与前提矛盾,因此严格无偏性成立
理论意义 1. 保障了N-P引理给出的最优检验是有效检验,不会出现“正确拒绝的概率低于错误拒绝的概率”的无效情况;
2. 为复合假设的检验理论奠定了基础:当无法找到全局UMPT时,可在无偏检验类中寻找一致最优无偏检验(UMPUT),解决多参数、双边检验问题

表5 三大经典应用示例全对比

分布类型 检验问题 似然比核心特性 最优检验(MPT/UMPT)形式 核心特点 对应实际检验方法
泊松分布\(P(\lambda)\) (i) \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda=\lambda_1(\lambda_1>\lambda_0)\)(求MPT);
(ii) \(H_0:\lambda=\lambda_0 \leftrightarrow H_1:\lambda>\lambda_0\)(求UMPT)
似然比是样本和\(T=\sum_{i=1}^n X_i\)的严格增函数,\(T \sim P(n\lambda_0)\)\(H_0\)下),离散型分布 $$\phi(x) = \begin{cases}1, & T > k_0 \ \gamma_0, & T = k_0 \ 0, & T < k_0\end{cases}$$
\(k_0\)\(1-\alpha\)分位数,\(\gamma_0\)为随机化概率
1. 离散型分布,需随机化检验精准控制水平;
2. 检验形式与备择参数\(\lambda_1\)无关,是单边复合假设的UMPT
泊松分布总体均值的单边检验
均匀分布\(R(0,\theta)\) \(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1(\theta_1>\theta_0)\),求水平\(\alpha\)的MPT 似然比仅取3个离散值:\(0、(\theta_0/\theta_1)^n、+\infty\),完全由样本最大值\(x_{(n)}\)决定,支撑集依赖参数 $$\phi(x) = \begin{cases}1, & \theta_0 < x_{(n)} \leq \theta_1 \ \alpha, & 0 \leq x_{(n)} \leq \theta_0 \ 0, & x_{(n)} > \theta_1\end{cases}$$ 1. 连续型分布但似然比为离散型,临界值仅能取\((\theta_0/\theta_1)^n\)
2. 随机化是实现水平\(\alpha\)的唯一方式,无随机化则检验水平只能为0或1
均匀分布总体上限的单边检验
正态分布\(N(\mu,\sigma_0^2)\)\(\sigma_0^2\)已知) (i) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu=\mu_1(\mu_1>\mu_0)\)(求MPT);
(ii) \(H_0:\mu=\mu_0 \leftrightarrow H_1:\mu>\mu_0\)(求UMPT);
(iii) \(H_0:\mu\leq\mu_0 \leftrightarrow H_1:\mu>\mu_0\)(求UMPT)
似然比是样本均值\(\bar{X}\)的严格增函数,\(\bar{X} \sim N(\mu_0,\sigma_0^2/n)\)\(H_0\)下),连续型分布 $$\phi(x) = \begin{cases}1, & \bar{X} > \mu_0 + \frac{\sigma_0}{\sqrt{n}}z_{1-\alpha} \ 0, & \bar{X} < \mu_0 + \frac{\sigma_0}{\sqrt{n}}z_{1-\alpha}\end{cases}$$ 1. 连续型分布,无需随机化,非随机化检验即可精准控制水平;
2. 检验形式与备择参数无关,是单边复合假设的UMPT;
3. 功效函数是\(\mu\)的严格增函数,满足复合原假设的水平约束
单正态总体均值的单边Z检验(日常最常用)

表6 复合假设UMPT通用推广引理

项目 详细内容
适用的三类检验问题 (i) 简单假设:\(H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1\)
(ii) 复合备择假设:\(H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\)
(iii) 复合原假设+复合备择假设:\(H_0: \theta \in \Theta_0 \longleftrightarrow H_1: \theta \in \Theta_1\)
核心结论1 \(\phi(x)\)是(i)的MPT,且\(\phi(x)\)的形式与备择参数\(\theta_1\)无关,则\(\phi(x)\)是(ii)的UMPT
核心结论2 \(\phi(x)\)是(ii)的UMPT,且同时是(iii)的水平\(\alpha\)检验(对所有\(\theta \in \Theta_0\)\(E_\theta[\phi(X)] \leq \alpha\)),则\(\phi(x)\)是(iii)的UMPT
核心应用条件 分布族为单调似然比分布族,似然比是某一统计量的单调函数,检验形式不随备择参数变化
核心价值 将N-P引理的适用范围从简单假设拓展到一大类复合假设,证明了单调似然比分布族的单边检验一定存在UMPT,为经典参数假设检验提供了统一的理论框架

posted on 2026-03-03 01:16  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航