昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

6.3单调似然比分布族的单边检验

单调似然比分布族的单边检验 完整讲解与推导

作为数理统计领域深耕多年的研究员,我将从背景起源→核心定义→定理推导→实例验证→归纳总结全链条,为你完整拆解这个假设检验的核心知识点。

一、背景引入:从NP引理的局限性到MLR的提出

Neyman-Pearson(NP)基本引理是假设检验的基石,它完美解决了简单原假设 ↔ 简单备择假设的最优势(MP)检验问题,给出了似然比检验的最优形式:

\[\text{当似然比} \ \lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)} \geq c \ \text{时拒绝} \ H_0 \]

其中\(c\)由显著性水平\(\alpha\)确定,保证\(P_{\theta_0}(\lambda(X)\geq c)=\alpha\)

但NP引理的应用存在严格限制:它仅能处理两个单点参数的检验问题,而实际科研与工程中,我们几乎都面对复合假设检验,最典型的三类单边检验问题为:

  1. \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1 \ (\theta_1>\theta_0)\)(简单vs简单,NP引理可解)
  2. \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(简单vs复合单边)
  3. \(H_0:\theta\leq\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(复合vs复合单边,最常用)

对于复合假设,我们需要找到一致最优检验(UMPT):即一个水平为\(\alpha\)的检验,对备择假设中所有的\(\theta\),它都是该水平下的MP检验。

要让NP引理的最优性从“单个\(\theta_1\)”推广到“所有\(\theta>\theta_0\)”,就需要分布族满足一个核心性质——单调似然比(MLR)性质,这也是本节内容的核心。


二、单调似然比(MLR)分布族 定义详解

2.1 正式定义

设单参数分布族\(\{f(x,\theta),\theta\in\Theta\subset\mathbb{R}\}\)\(f(x,\theta)\)为总体的概率密度(连续型)或分布律(离散型),若满足以下两个条件:

  1. 可识别性条件:当\(\theta_1\neq\theta_2\)时,集合\(\{x:f(x,\theta_1)\neq f(x,\theta_2)\}\)的测度大于0。
    (含义:不同参数对应不同的分布,否则假设检验无意义,无法区分参数)
  2. 似然比单调性条件:对任意\(\theta_1>\theta_0\),似然比

    \[\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)} \]

    是统计量\(T=T(x)\)非减函数,即:若\(T(x_1)\geq T(x_2)\),则\(\lambda(x_1)\geq\lambda(x_2)\)

则称该分布族关于统计量\(T=T(x)\)单调似然比分布族,简称MLR分布族。

2.2 定义的核心解读

  1. 非减而非严增:定义仅要求似然比随\(T(x)\)非减,而非严格递增,这大幅放宽了适用范围,覆盖了绝大多数常用的参数分布族。
  2. 核心直觉:似然比\(\lambda(x)\)的含义是“观测到\(x\)时,样本来自\(\theta_1\)的可能性/来自\(\theta_0\)的可能性”。MLR性质说明:\(T(x)\)越大,样本来自更大参数\(\theta\)的可能性越高,也就是越支持备择假设\(H_1:\theta>\theta_0\)
  3. 最优检验的形式统一:正因为似然比的单调性,\(\lambda(x)\geq c\)(NP引理的拒绝域)可以等价转化为\(T(x)\geq c\),这个形式不依赖于具体的\(\theta_1\),只和\(T(x)\)有关,这是UMPT存在的核心前提。

2.3 典型MLR分布族验证(实例)

绝大多数常用的单参数分布都属于MLR分布族,且均为单参数指数型分布族,这里给出核心验证:

例1:伯努利分布族\(B(1,p)\)

分布律:\(f(x,p)=p^x(1-p)^{1-x},x\in\{0,1\},p\in(0,1)\)
任取\(p_1>p_0\),似然比:

\[\lambda(x)=\frac{f(x,p_1)}{f(x,p_0)}=\left(\frac{p_1(1-p_0)}{p_0(1-p_1)}\right)^x \cdot \frac{1-p_1}{1-p_0} \]

\(p_1>p_0\),故\(\frac{p_1(1-p_0)}{p_0(1-p_1)}>1\)\(\lambda(x)\)\(x\)的严增函数,因此该分布族关于\(T(x)=x\)是MLR分布族。

例2:正态分布族\(N(\mu,1)\)(方差已知)

密度函数:\(f(x,\mu)=\frac{1}{\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2}\right\},\mu\in\mathbb{R}\)
任取\(\mu_1>\mu_0\),似然比:

\[\lambda(x)=\exp\left\{(\mu_1-\mu_0)x - \frac{\mu_1^2-\mu_0^2}{2}\right\} \]

\(\mu_1-\mu_0>0\)\(\lambda(x)\)\(x\)的严增函数,因此该分布族关于\(T(x)=x\)是MLR分布族。

例3:单参数指数型分布族的通用结论

单参数指数型分布族的标准形式为:

\[f(x,\theta)=C(\theta)\exp\left\{Q(\theta)T(x)\right\}h(x) \]

\(Q(\theta)\)\(\theta\)的严格单调函数,则该分布族一定是MLR分布族:

  • \(Q(\theta)\)严增:似然比是\(T(x)\)的严增函数,关于\(T(x)\)为MLR分布族;
  • \(Q(\theta)\)严减:似然比是\(-T(x)\)的严增函数,关于\(-T(x)\)为MLR分布族。

三、MLR分布族单边检验的核心定理与完整证明

我们分两步给出核心定理:先解决简单原假设vs复合备择的UMPT,再推广到最常用的复合原假设vs复合备择的场景。

3.1 定理1:简单原假设的单边UMPT

定理内容

设单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\)关于统计量\(T=T(x)\)是MLR分布族,对于检验问题

\[H_0:\theta=\theta_0 \quad \longleftrightarrow \quad H_1:\theta>\theta_0 \]

水平为\(\alpha\)的UMPT存在,且检验函数(拒绝规则)为:

\[\phi(x)= \begin{cases} 1, & T(x) > c \\ r, & T(x) = c \\ 0, & T(x) < c \end{cases}\]

其中常数\(c\)\(r(0\leq r\leq1)\)由显著性水平\(\alpha\)确定,满足:

\[E_{\theta_0}[\phi(X)] = P_{\theta_0}(T(X)>c) + r P_{\theta_0}(T(X)=c) = \alpha \]

同时,该检验的势函数\(\beta(\theta)=E_\theta[\phi(X)]\)\(\theta\)非减函数


完整证明

证明分为两部分:1. 证明\(\phi(x)\)是UMPT;2. 证明势函数的单调性

第一部分:证明\(\phi(x)\)是该检验问题的UMPT
  1. 任取一个固定的\(\theta_1>\theta_0\),考虑简单vs简单的检验问题\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)
    根据NP引理,该问题水平为\(\alpha\)的MP检验,拒绝域为似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)} \geq k\),其中\(k\)满足\(P_{\theta_0}(\lambda(X)\geq k)=\alpha\)

  2. 由MLR分布族的定义,\(\theta_1>\theta_0\)时,\(\lambda(x)\)\(T(x)\)的非减函数,因此有等价关系:

    \[\lambda(x) \geq k \quad \Longleftrightarrow \quad T(x) \geq c \]

    其中\(c\)是与\(k\)对应的常数:

    • 连续型分布:\(T(x)\)是连续随机变量,\(P(T(x)=c)=0\),无需随机化,\(r=0\),拒绝域为\(T(x)>c\)
    • 离散型分布:\(T(x)\)是离散随机变量,\(P(T(x)\geq c)\)可能无法恰好等于\(\alpha\),因此在\(T(x)=c\)处引入随机化因子\(r\),补足显著性水平。
  3. 关键结论:上述等价关系中,\(c\)\(r\)仅由\(\theta_0\)\(\alpha\)确定,与具体的\(\theta_1\)无关
    也就是说,对于任意的\(\theta_1>\theta_0\),该检验\(\phi(x)\)都是水平为\(\alpha\)的MP检验。根据UMPT的定义,\(\phi(x)\)就是该检验问题水平为\(\alpha\)的UMPT。

第二部分:证明势函数\(\beta(\theta)=E_\theta[\phi(X)]\)\(\theta\)的非减函数

要证:对任意\(\theta_2>\theta_1\),有\(\beta(\theta_2)\geq\beta(\theta_1)\)

  1. 考虑检验问题\(H_0':\theta=\theta_1 \leftrightarrow H_1':\theta=\theta_2\)\(\theta_2>\theta_1\)。由MLR性质,该问题的水平为\(\alpha'=\beta(\theta_1)\)的MP检验,形式同样为\(\phi(x)\)

  2. 根据NP引理的核心结论:任何MP检验在备择假设下的势,一定不小于检验的水平,即:

    \[E_{\theta_2}[\phi(X)] \geq E_{\theta_1}[\phi(X)] \]

    也就是\(\beta(\theta_2)\geq\beta(\theta_1)\),得证。

    补充严谨推导(协方差不等式法):
    \(\phi(x)\)\(T(x)\)的非减函数,\(\lambda(x)=\frac{f(x,\theta_2)}{f(x,\theta_1)}\)也是\(T(x)\)的非减函数,根据切比雪夫协方差不等式:两个非减函数的协方差非负,即

    \[Cov_{\theta_1}(\phi(X),\lambda(X)) = E_{\theta_1}[\phi(X)\lambda(X)] - E_{\theta_1}[\phi(X)]E_{\theta_1}[\lambda(X)] \geq 0 \]

    \(E_{\theta_1}[\lambda(X)] = \int \frac{f(x,\theta_2)}{f(x,\theta_1)} \cdot f(x,\theta_1) dx = 1\),因此

    \[E_{\theta_1}[\phi(X)\lambda(X)] = E_{\theta_2}[\phi(X)] = \beta(\theta_2) \geq E_{\theta_1}[\phi(X)] = \beta(\theta_1) \]


3.2 定理2:复合原假设的单边UMPT

定理内容

在定理1的MLR分布族条件下,对于最常用的检验问题

\[H_0:\theta\leq\theta_0 \quad \longleftrightarrow \quad H_1:\theta>\theta_0 \]

定理1给出的检验函数\(\phi(x)\)同样是该问题水平为\(\alpha\)的UMPT


完整证明

复合原假设的检验,对水平的要求是:对所有\(\theta\in H_0\)(即\(\theta\leq\theta_0\)),都有\(E_\theta[\phi(X)] \leq \alpha\),即势函数在原假设参数空间上的上确界不超过\(\alpha\)。证明分为两步:

  1. 证明\(\phi(x)\)是该问题水平为\(\alpha\)的检验
    由定理1,我们已经证明\(\beta(\theta)=E_\theta[\phi(X)]\)\(\theta\)的非减函数。因此,对所有\(\theta\leq\theta_0\),有:

    \[\beta(\theta) \leq \beta(\theta_0) = \alpha \]

    完全满足水平为\(\alpha\)的检验的要求。

  2. 证明\(\phi(x)\)是该问题的UMPT
    任取一个水平为\(\alpha\)的检验\(\phi'(x)\),即对所有\(\theta\leq\theta_0\),有\(E_\theta[\phi'(X)] \leq \alpha\)
    对任意的\(\theta_1>\theta_0\),考虑简单vs简单的检验问题\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)

    • \(\phi(x)\)是该问题水平为\(\alpha\)的MP检验;
    • \(\phi'(x)\)是该问题的一个水平\(\leq\alpha\)的检验(因\(E_{\theta_0}[\phi'(X)] \leq \alpha\))。

    根据NP引理,MP检验的势是所有同水平检验中最大的,因此:

    \[E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\phi'(X)] \]

    由于\(\theta_1>\theta_0\)是任意的,因此\(\phi(x)\)对备择假设中所有的\(\theta\),都具有最大的势,即\(\phi(x)\)是该检验问题水平为\(\alpha\)的UMPT。


3.3 对称结论:左侧单边检验的UMPT

对于左侧单边检验问题

\[H_0:\theta\geq\theta_0 \quad \longleftrightarrow \quad H_1:\theta<\theta_0 \]

基于MLR分布族的对称性,水平为\(\alpha\)的UMPT为:

\[\phi(x)= \begin{cases} 1, & T(x) < c \\ r, & T(x) = c \\ 0, & T(x) > c \end{cases}\]

其中\(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\),证明过程与右侧检验完全对称,核心是\(\theta_1<\theta_0\)时,似然比随\(T(x)\)减小而增大,因此拒绝域为\(T(x)<c\)


四、完整实例:正态总体均值的单边UMPT

\(X_1,X_2,\dots,X_n\)是来自正态总体\(N(\mu,1)\)的独立同分布样本,求检验问题\(H_0:\mu\leq0 \leftrightarrow H_1:\mu>0\)的水平为\(\alpha\)的UMPT。

步骤1:验证MLR性质

样本联合密度为:

\[f(x,\mu) = (2\pi)^{-n/2} \exp\left\{ -\frac{1}{2}\sum_{i=1}^n (x_i-\mu)^2 \right\} = (2\pi)^{-n/2}\exp\left\{-\frac{1}{2}\sum x_i^2\right\} \cdot \exp\left\{n\mu \bar{x} - \frac{n\mu^2}{2}\right\} \]

任取\(\mu_1>\mu_0\),似然比:

\[\lambda(x)=\frac{f(x,\mu_1)}{f(x,\mu_0)} = \exp\left\{n(\mu_1-\mu_0)\bar{x} - \frac{n(\mu_1^2-\mu_0^2)}{2}\right\} \]

\(\mu_1-\mu_0>0\)\(\lambda(x)\)\(\bar{x}\)的严增函数,因此该分布族关于\(T(x)=\bar{x}\)是MLR分布族。

步骤2:确定UMPT的形式

根据定理2,UMPT的形式为:

\[\phi(x)= \begin{cases} 1, & \bar{x} > c \\ 0, & \bar{x} \leq c \end{cases}\]

(正态分布为连续型,无需随机化,\(r=0\)

步骤3:确定临界值\(c\)

\(E_{\mu=0}[\phi(X)]=\alpha\),即\(P_{\mu=0}(\bar{X}>c)=\alpha\)
\(\mu=0\)时,\(\bar{X} \sim N(0,1/n)\),因此\(\sqrt{n}\bar{X} \sim N(0,1)\),则:

\[P_{\mu=0}(\bar{X}>c) = P(\sqrt{n}\bar{X} > \sqrt{n}c) = 1-\Phi(\sqrt{n}c) = \alpha \]

其中\(\Phi(\cdot)\)为标准正态分布的分布函数,因此\(\Phi(\sqrt{n}c)=1-\alpha\),得\(\sqrt{n}c=z_{1-\alpha}\),即\(c=\frac{z_{1-\alpha}}{\sqrt{n}}\)\(z_{1-\alpha}\)为标准正态分布的\(1-\alpha\)分位数)。

最终结论

该检验问题的水平为\(\alpha\)的UMPT为:当样本均值\(\bar{X} > \frac{z_{1-\alpha}}{\sqrt{n}}\)时拒绝原假设\(H_0\),否则不拒绝\(H_0\),这与我们常用的单边Z检验完全一致,也验证了常用单边检验的最优性。


五、知识点归纳总结表

分类 核心内容 关键性质/条件 补充说明
单调似然比(MLR)分布族定义 单参数分布族\(f(x,\theta)\)满足:
1. 可识别性:\(\theta_1≠\theta_2\)时,\(\mu\{f(x,\theta_1)≠f(x,\theta_2)\}>0\)
2. 似然比单调性:\(\theta_1>\theta_0\)时,\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)\(T(x)\)的非减函数
1. 仅要求似然比非减,不要求严增,覆盖范围更广
2. 核心逻辑:\(T(x)\)越大,越支持\(\theta\)更大的备择假设
单参数指数型分布族天然满足MLR性质,是最常见的MLR分布族来源
简单原假设右侧单边检验UMPT
\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\)
水平为\(\alpha\)的UMPT检验函数:
$$\phi(x)=\begin{cases}1, & T(x)>c \ r, & T(x)=c \ 0, & T(x)<c\end{cases}$$
\(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\)
1. 检验形式仅由\(T(x)\)决定,与备择假设的具体\(\theta_1\)无关
2. 对所有\(\theta>\theta_0\),均为最优势检验
连续型分布无需随机化,\(r=0\);离散型分布用\(r\)补足显著性水平
复合原假设右侧单边检验UMPT
\(H_0:\theta≤\theta_0 \leftrightarrow H_1:\theta>\theta_0\)
上述\(\phi(x)\)同样是该问题水平为\(\alpha\)的UMPT 1. 势函数\(\beta(\theta)\)\(\theta\)的非减函数
2. 原假设上\(\beta(\theta)≤\beta(\theta_0)=\alpha\),满足水平要求
实际应用最广泛的形式,常用的Z检验、t检验、泊松分布检验的单边形式均属于此类
左侧单边检验UMPT
\(H_0:\theta≥\theta_0 \leftrightarrow H_1:\theta<\theta_0\)
水平为\(\alpha\)的UMPT检验函数:
$$\phi(x)=\begin{cases}1, & T(x)<c \ r, & T(x)=c \ 0, & T(x)>c\end{cases}$$
\(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\)
与右侧检验对称,似然比随\(T(x)\)减小而增大,拒绝域为\(T(x)<c\) 势函数仍为\(\theta\)的非减函数,保证原假设上的水平约束
MLR分布族势函数性质 检验的势函数\(\beta(\theta)=E_\theta[\phi(X)]\)\(\theta\)的非减函数 1. 复合原假设的检验水平在\(\theta=\theta_0\)处达到最大值
2. 备择假设中,\(\theta\)\(\theta_0\)越远,检验的势越高,检验效果越好
是复合原假设检验满足水平要求的核心依据
常见MLR分布族与对应统计量\(T(x)\) 1. 伯努利分布\(B(1,p)\)\(T(x)=\sum_{i=1}^n x_i\)
2. 泊松分布\(P(\lambda)\)\(T(x)=\sum_{i=1}^n x_i\)
3. 正态分布\(N(\mu,\sigma^2)\)\(\sigma^2\)已知):\(T(x)=\bar{x}\)
4. 指数分布\(Exp(\beta)\)\(T(x)=-\sum_{i=1}^n x_i\)
均属于单参数指数型分布族,天然满足MLR性质 多参数分布族固定冗余参数后,单参数部分仍可满足MLR性质

核心逻辑闭环

NP引理解决了简单vs简单的最优检验 → MLR性质保证了所有备择假设下的MP检验形式统一为\(T(x)\geq c\) → 得到简单原假设单边检验的UMPT → 势函数的单调性保证了复合原假设下的水平约束,最终得到了实际中最常用的复合单边检验的UMPT。这也是现代参数假设检验的核心理论基础。

习题讲解

例题完整讲解与全分布推导验证

本题的核心是验证三类经典单参数分布族均为单调似然比(MLR)分布族,我会先拆解例题中两点分布的推导细节,再补全例题提及的正态分布、泊松分布的完整验证,最后总结核心规律。


一、先回顾MLR分布族的核心定义

对于单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若满足:

  1. 可识别性:\(\theta_1\neq\theta_2\)时,不同参数对应分布有差异;
  2. 单调性:对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)是统计量\(T(x)\)非减(增)函数

则称该分布族关于\(T(x)\)为MLR分布族,这是单边假设检验存在一致最优检验(UMPT)的核心前提。


二、两点分布(伯努利分布)\(b(1,\theta)\)的MLR完整验证

1. 样本联合分布推导

\(X_1,X_2,\dots,X_n\)独立同分布,均服从参数为\(\theta\)的两点分布,单个样本的分布律为:

\[f(x_i,\theta) = \theta^{x_i}(1-\theta)^{1-x_i}, \quad x_i\in\{0,1\}, \theta\in(0,1) \]

\(n\)个独立样本的联合分布律(似然函数)为各样本分布的乘积:

\[f(x,\theta) = \prod_{i=1}^n \theta^{x_i}(1-\theta)^{1-x_i} \]

对式子化简:

  • 记充分统计量\(T=T(x)=\sum_{i=1}^n x_i\)(样本中取值为1的总个数);
  • \(\theta\)的幂次合并为\(\theta^{\sum_{i=1}^n x_i}=\theta^T\)
  • \((1-\theta)\)的幂次合并为\((1-\theta)^{\sum_{i=1}^n (1-x_i)}=(1-\theta)^{n-T}\)

最终得到联合分布的简洁形式:

\[f(x,\theta) = \theta^{T}(1-\theta)^{n-T}, \quad T=\sum_{i=1}^n x_i \]

2. 似然比计算与单调性验证

任取\(\theta_1>\theta_0\)\(\theta_1,\theta_0\in(0,1)\)),计算似然比:

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = \frac{\theta_1^{T}(1-\theta_1)^{n-T}}{\theta_0^{T}(1-\theta_0)^{n-T}} \]

将式子重组,把含\(T\)的项与常数项拆分:

\[\lambda(x) = \left( \frac{\theta_1}{\theta_0} \cdot \frac{1-\theta_0}{1-\theta_1} \right)^T \cdot \left( \frac{1-\theta_1}{1-\theta_0} \right)^n \]

单调性分析:

  • \(\theta_1>\theta_0\),故\(\frac{\theta_1}{\theta_0}>1\)\(\frac{1-\theta_0}{1-\theta_1}>1\),因此底数\(\frac{\theta_1(1-\theta_0)}{\theta_0(1-\theta_1)}>1\)
  • 指数函数\(a^T\)\(a>1\)时,是关于\(T\)的严格增函数;\(\left( \frac{1-\theta_1}{1-\theta_0} \right)^n\)是与样本无关的常数,不影响单调性。

因此,似然比\(\lambda(x)\)\(T(x)=\sum_{i=1}^n x_i\)的严格增函数,完全满足MLR分布族的定义。


三、正态分布\(N(0,\sigma^2)\)的MLR完整验证(例题提及,补全推导)

1. 样本联合分布推导

\(X_1,X_2,\dots,X_n\)独立同分布,均服从均值为0、方差为\(\sigma^2\)的正态分布,单个样本的概率密度为:

\[f(x_i,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left\{ -\frac{x_i^2}{2\sigma^2} \right\}, \quad x_i\in\mathbb{R}, \sigma^2>0 \]

\(n\)个独立样本的联合密度为:

\[f(x,\sigma^2) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left\{ -\frac{x_i^2}{2\sigma^2} \right\} \]

化简后:

\[f(x,\sigma^2) = (2\pi\sigma^2)^{-n/2} \exp\left\{ -\frac{1}{2\sigma^2} T(x) \right\}, \quad T(x)=\sum_{i=1}^n x_i^2 \]

2. 似然比计算与单调性验证

取单参数\(\theta=\sigma^2\),任取\(\sigma_1^2 > \sigma_0^2>0\),计算似然比:

\[\lambda(x) = \frac{f(x,\sigma_1^2)}{f(x,\sigma_0^2)} = \left( \frac{\sigma_0^2}{\sigma_1^2} \right)^{n/2} \cdot \exp\left\{ \frac{T(x)}{2} \left( \frac{1}{\sigma_0^2} - \frac{1}{\sigma_1^2} \right) \right\} \]

单调性分析:

  • \(\sigma_1^2>\sigma_0^2\),故\(\frac{1}{\sigma_0^2} - \frac{1}{\sigma_1^2} > 0\),指数部分为关于\(T(x)\)的正系数线性项;
  • 指数函数\(\exp\{k\cdot T(x)\}\)\(k>0\)时,是关于\(T(x)\)的严格增函数,常数项不影响单调性。

因此,该正态分布族关于\(T(x)=\sum_{i=1}^n x_i^2\)是MLR分布族。


四、泊松分布\(P(\lambda)\)的MLR完整验证(例题提及,补全推导)

1. 样本联合分布推导

\(X_1,X_2,\dots,X_n\)独立同分布,均服从参数为\(\lambda\)的泊松分布,单个样本的分布律为:

\[f(x_i,\lambda) = \frac{\lambda^{x_i} e^{-\lambda}}{x_i!}, \quad x_i=0,1,2,\dots, \lambda>0 \]

\(n\)个独立样本的联合分布律为:

\[f(x,\lambda) = \prod_{i=1}^n \frac{\lambda^{x_i} e^{-\lambda}}{x_i!} \]

化简后:

\[f(x,\lambda) = \left( \prod_{i=1}^n \frac{1}{x_i!} \right) \cdot \lambda^{T(x)} e^{-n\lambda}, \quad T(x)=\sum_{i=1}^n x_i \]

2. 似然比计算与单调性验证

任取\(\lambda_1>\lambda_0>0\),计算似然比(与样本无关的常数项直接约去):

\[\lambda(x) = \frac{f(x,\lambda_1)}{f(x,\lambda_0)} = \left( \frac{\lambda_1}{\lambda_0} \right)^{T(x)} \cdot e^{-n(\lambda_1-\lambda_0)} \]

单调性分析:

  • \(\lambda_1>\lambda_0\),故底数\(\frac{\lambda_1}{\lambda_0}>1\)\(\left( \frac{\lambda_1}{\lambda_0} \right)^{T(x)}\)是关于\(T(x)\)的严格增函数;
  • 常数项\(e^{-n(\lambda_1-\lambda_0)}\)不影响单调性。

因此,泊松分布族关于\(T(x)=\sum_{i=1}^n x_i\)是MLR分布族。


五、核心规律与汇总表

1. 本质共性

这三类分布均属于单参数指数型分布族,其标准形式为:

\[f(x,\theta) = C(\theta) \exp\left\{ Q(\theta) T(x) \right\} h(x) \]

只要\(Q(\theta)\)\(\theta\)的严格单调函数,该分布族就一定是MLR分布族,这也是三类分布天然满足MLR性质的根本原因。

2. 三类分布核心信息汇总

分布类型 单参数 充分统计量\(T(x)\) 似然比单调性 MLR核心依据
两点分布\(b(1,\theta)\) 成功概率\(\theta\in(0,1)\) \(\sum_{i=1}^n x_i\) 关于\(T(x)\)严格增 \(Q(\theta)=\ln\frac{\theta}{1-\theta}\)\(\theta\)的严格增函数
正态分布\(N(0,\sigma^2)\) 方差\(\sigma^2>0\) \(\sum_{i=1}^n x_i^2\) 关于\(T(x)\)严格增 \(Q(\theta)=-\frac{1}{2\sigma^2}\)\(\sigma^2\)的严格增函数
泊松分布\(P(\lambda)\) 强度\(\lambda>0\) \(\sum_{i=1}^n x_i\) 关于\(T(x)\)严格增 \(Q(\theta)=\ln\lambda\)\(\lambda\)的严格增函数

3. 应用价值

验证这三类分布的MLR性质后,可直接套用单边检验的UMPT定理,得到对应参数单边检验的一致最优检验,这也是日常使用的比例检验、方差单边检验、泊松计数检验的理论最优性依据。


单参数指数族MLR性质 完整讲解与深度推导

本题是单调似然比(MLR)分布族最核心的通用结论:所有满足自然参数单调的单参数指数族,天然是MLR分布族。此前的伯努利、泊松、正态分布均是该通用结论的特例,下面我将从前置定义、完整推导、细节解读、拓展补充四个维度,完整拆解这个知识点。


一、前置核心定义回顾

1. 单参数指数型分布族的标准形式

本题给出的是单参数指数族的标准正则形式:

\[f(x,\theta) = h(x)\exp\left\{ Q(\theta)T(x) - b(\theta) \right\} \]

各符号的含义与约束:

  • \(h(x) \geq 0\):仅与样本\(x\)有关的非负函数,与参数\(\theta\)无关;
  • \(T(x)\):样本的充分统计量(由因子分解定理可直接证明);
  • \(Q(\theta)\):仅与参数\(\theta\)有关的函数,称为自然参数,是决定单调性的核心;
  • \(b(\theta)\):仅与参数\(\theta\)有关的累积量生成函数,作用是保证密度/分布律的积分为1,满足正则性条件;
  • 可识别性:当\(\theta_1 \neq \theta_2\)时,\(\mu\{f(x,\theta_1)\neq f(x,\theta_2)\}>0\),即不同参数对应不同分布,是MLR定义的前提条件。

2. MLR分布族的核心定义

对于单参数分布族\(\{f(x,\theta), \theta\in\Theta\}\),若对任意\(\theta_1 > \theta_0\),似然比

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} \]

是统计量\(T(x)\)非减(增)函数,则称该分布族关于\(T(x)\)为单调似然比分布族(MLR分布族)。


二、完整推导与单调性证明

步骤1:写出似然比的完整表达式

任取\(\theta_1 > \theta_0\),将指数族形式代入似然比定义:

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = \frac{h(x)\exp\left\{ Q(\theta_1)T(x) - b(\theta_1) \right\}}{h(x)\exp\left\{ Q(\theta_0)T(x) - b(\theta_0) \right\}} \]

步骤2:化简似然比

  1. 分子分母的\(h(x)\)完全相同,且与参数\(\theta\)无关,直接约去,不影响似然比的单调性;
  2. 利用指数运算性质\(\frac{\exp(A)}{\exp(B)} = \exp(A-B)\),将分式转化为单指数形式:

\[\lambda(x) = \exp\left\{ \left[ Q(\theta_1)T(x) - b(\theta_1) \right] - \left[ Q(\theta_0)T(x) - b(\theta_0) \right] \right\} \]

步骤3:整理指数项,拆分核心变量与常数项

将含\(T(x)\)的项合并,与样本无关的常数项分离:

\[\lambda(x) = \exp\left\{ \underbrace{\left[ Q(\theta_1) - Q(\theta_0) \right]}_{\text{系数}k} \cdot T(x) - \underbrace{\left[ b(\theta_1) - b(\theta_0) \right]}_{\text{常数}C} \right\} \]

步骤4:严格证明单调性

本题给出核心条件:\(Q(\theta)\)\(\theta\)的增函数,结合\(\theta_1 > \theta_0\),可直接得到:

\[Q(\theta_1) - Q(\theta_0) > 0 \]

即系数\(k>0\),由此可分两步证明单调性:

  1. 指数内的核心项\(k\cdot T(x) - C\)\(k>0\),因此该项是\(T(x)\)严格增函数,常数项\(C\)不改变单调性;
  2. 外层的指数函数\(\exp(\cdot)\)是定义域上的严格增函数,严格增函数的复合仍为严格增函数。

因此,整个似然比\(\lambda(x)\)\(T(x)\)的严格增函数,完全满足MLR分布族的定义,该单参数指数族是关于\(T(x)\)的MLR分布族。


三、关键细节拓展与补充

1. 对称情况:\(Q(\theta)\)\(\theta\)的严格减函数

\(Q(\theta)\)\(\theta\)的严格减函数,则当\(\theta_1 > \theta_0\)时,\(Q(\theta_1)-Q(\theta_0) < 0\),此时:

  • 似然比\(\lambda(x)\)\(T(x)\)的严格减函数;
  • 等价于\(\lambda(x)\)\(-T(x)\)的严格增函数,因此该分布族关于\(-T(x)\)是MLR分布族

示例:指数分布\(Exp(\lambda)\),密度为\(f(x,\lambda)=\lambda e^{-\lambda x}(x>0)\),写成指数族形式为:

\[f(x,\lambda) = \exp\left\{ -\lambda \cdot x + \ln\lambda \right\} \]

其中\(Q(\lambda)=-\lambda\)\(\lambda\)的严格减函数,\(T(x)=x\),因此该分布族关于\(-T(x)=-x\)是MLR分布族。

2. 该结论的核心价值

这个通用结论是MLR分布族的最核心充分条件,几乎所有常用的单参数分布(伯努利、二项、泊松、正态、指数、伽马、几何分布等)都属于单参数指数族,只需验证\(Q(\theta)\)的单调性,即可直接判断MLR性质,无需每次重新计算似然比,大幅简化了单边检验UMPT的求解过程。

3. 与前序例题的对应关系

此前验证的三类分布,均是该通用结论的特例:

分布类型 指数族形式的\(Q(\theta)\) \(Q(\theta)\)的单调性 MLR对应的统计量\(T(x)\)
伯努利分布\(b(1,\theta)\) \(\ln\left( \frac{\theta}{1-\theta} \right)\) 严格增 \(\sum_{i=1}^n x_i\)
泊松分布\(P(\lambda)\) \(\ln\lambda\) 严格增 \(\sum_{i=1}^n x_i\)
正态分布\(N(0,\sigma^2)\) \(-\frac{1}{2\sigma^2}\) 严格增 \(\sum_{i=1}^n x_i^2\)

四、核心结论总结

  1. 通用定理:正则单参数指数族\(f(x,\theta) = h(x)\exp\left\{ Q(\theta)T(x) - b(\theta) \right\}\),若\(Q(\theta)\)\(\theta\)的严格单调函数,则该分布族一定是MLR分布族。
  2. 单调性对应规则
    • \(Q(\theta)\)严格增 → 关于\(T(x)\)为MLR分布族;
    • \(Q(\theta)\)严格减 → 关于\(-T(x)\)为MLR分布族。
  3. 应用延伸:满足该性质的分布族,其单边假设检验一定存在一致最优检验(UMPT),检验形式可直接由\(T(x)\)的阈值确定,是参数假设检验的核心理论基础。

均匀分布R(0,θ)的MLR分布族验证 完整讲解与深度推导

本题是单调似然比(MLR)分布族的经典非指数族案例,和此前的指数族例子形成关键区分,我将从前置概念、分步推导、细节解读、核心拓展四个维度,完整拆解这个知识点。


一、前置核心概念回顾

1. 基础分布与符号说明

  • 均匀分布\(R(0,\theta)\)(也记\(U(0,\theta)\)):区间\((0,\theta)\)上的连续均匀分布,单个样本\(X_1\)的概率密度为:

    \[f(x_1,\theta) = \frac{1}{\theta} I\{0 \leq x_1 \leq \theta\}, \quad \theta>0 \]

    其中\(I\{A\}\)指示函数:事件\(A\)发生时取1,不发生时取0,是本例题的核心化简工具。
  • 顺序统计量:对\(n\)个独立样本\(X_1,X_2,\dots,X_n\),记
    • \(x_{(1)} = \min\{X_1,X_2,\dots,X_n\}\)(样本最小值)
    • \(x_{(n)} = \max\{X_1,X_2,\dots,X_n\}\)(样本最大值)
      核心等价关系:所有样本满足\(0\leq X_i \leq \theta\),当且仅当\(x_{(1)}\geq0\)\(x_{(n)}\leq\theta\)
  • MLR分布族定义:对单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)是统计量\(T(x)\)非减函数,则称该分布族关于\(T(x)\)为MLR分布族。

2. 本例题的特殊性

均匀分布\(R(0,\theta)\)的支撑集(密度非零的区域)与参数\(\theta\)相关,不属于单参数指数族,是MLR分布族的典型非指数族案例,证明了MLR分布族的覆盖范围比单参数指数族更广。


二、完整分步推导与证明

步骤1:推导样本的联合概率密度

\(X_1,X_2,\dots,X_n\)独立同分布于\(R(0,\theta)\),独立样本的联合密度为单个样本密度的乘积:

\[f(x,\theta) = \prod_{i=1}^n f(x_i,\theta) = \prod_{i=1}^n \left[ \frac{1}{\theta} I\{0 \leq x_i \leq \theta\} \right] \]

对式子进行拆分化简:

  1. 常数项:\(\prod_{i=1}^n \frac{1}{\theta} = \frac{1}{\theta^n}\)
  2. 指示函数项:\(\prod_{i=1}^n I\{0 \leq x_i \leq \theta\}\),根据顺序统计量的等价关系,所有样本满足\(0\leq x_i\leq\theta\),等价于最小值非负、最大值不超过\(\theta\),因此:

    \[\prod_{i=1}^n I\{0 \leq x_i \leq \theta\} = I\{x_{(1)}\geq0\} \cdot I\{x_{(n)}\leq\theta\} \]

最终得到联合密度的简洁形式:

\[f(x,\theta) = \frac{1}{\theta^n} I\{x_{(1)}\geq0\} I\{x_{(n)}\leq\theta\} \]


步骤2:计算似然比\(\lambda(x)\)

任取\(\theta_1>\theta_0>0\),根据似然比定义,代入联合密度:

\[\lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = \frac{\frac{1}{\theta_1^n} I\{x_{(1)}\geq0\} I\{x_{(n)}\leq\theta_1\}}{\frac{1}{\theta_0^n} I\{x_{(1)}\geq0\} I\{x_{(n)}\leq\theta_0\}} \]

化简规则:

  1. 仅考虑分布的支撑集(密度非零区域),即\(I\{x_{(1)}\geq0\}=1\),分子分母的该项可直接约去;
  2. 常数项合并为\(\left( \frac{\theta_0}{\theta_1} \right)^n\),因\(\theta_1>\theta_0>0\),该项为正的常数。

最终化简为:

\[\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot \frac{I\{x_{(n)}\leq\theta_1\}}{I\{x_{(n)}\leq\theta_0\}} \]


步骤3:分段分析似然比的核心项\(U(x_{(n)})\)

\(U(x_{(n)}) = \frac{I\{x_{(n)}\leq\theta_1\}}{I\{x_{(n)}\leq\theta_0\}}\),结合\(\theta_1>\theta_0\)的前提,对\(x_{(n)}\geq0\)分区间讨论:

  1. 区间1:\(0 \leq x_{(n)} \leq \theta_0\)
    \(x_{(n)}\leq\theta_0\)自然满足\(x_{(n)}\leq\theta_1\),因此分子\(I\{x_{(n)}\leq\theta_1\}=1\),分母\(I\{x_{(n)}\leq\theta_0\}=1\),得\(U(x_{(n)})=1\)

  2. 区间2:\(\theta_0 < x_{(n)} \leq \theta_1\)
    \(x_{(n)}>\theta_0\),分母\(I\{x_{(n)}\leq\theta_0\}=0\)\(x_{(n)}\leq\theta_1\),分子\(I\{x_{(n)}\leq\theta_1\}=1\),因此\(U(x_{(n)})=+\infty\)(表示似然比趋于无穷,样本来自\(\theta_1\)的可能性远大于\(\theta_0\))。

  3. 区间3:\(x_{(n)} > \theta_1\)
    分子分母的指示函数均为0,属于两个分布的支撑集之外,无统计意义,无需讨论。

因此\(U(x_{(n)})\)的分段形式为:

\[U(x_{(n)}) = \begin{cases} 1, & 0 \leq x_{(n)} \leq \theta_0 \\ +\infty, & \theta_0 < x_{(n)} \leq \theta_1 \end{cases}\]


步骤4:证明似然比的单调性,验证MLR性质

  1. 证明\(U(x_{(n)})\)\(x_{(n)}\)的非减函数
    非减函数的定义:若\(x_1 \leq x_2\),则\(g(x_1) \leq g(x_2)\)

    • \(x_{(n)}\)从0增加到\(\theta_0\)时,\(U(x_{(n)})\)恒为1,满足非减;
    • \(x_{(n)}\)超过\(\theta_0\)进入\((\theta_0,\theta_1]\)区间时,\(U(x_{(n)})\)从1跳变到\(+\infty\),是向上跳变,仍满足非减。
      因此\(U(x_{(n)})\)\(x_{(n)}\)的非减函数。
  2. 证明\(\lambda(x)\)\(x_{(n)}\)的非减函数
    似然比\(\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot U(x_{(n)})\),其中\(\left( \frac{\theta_0}{\theta_1} \right)^n\)是正的常数。
    正的常数乘以非减函数,结果仍为非减函数;且\(\lambda(x)\)\(U(x_{(n)})\)的严格增一次函数,复合后\(\lambda(x)\)\(x_{(n)}\)的非减函数。

  3. 最终结论
    对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)\)\(T(x)=x_{(n)}\)的非减函数,完全符合MLR分布族的定义,因此该分布族关于\(T(x)=x_{(n)}\)为MLR分布族。


三、关键细节与易错点解读

  1. 指示函数的核心作用
    均匀分布的支撑集与参数相关,必须通过指示函数明确密度非零的区域,若直接忽略指示函数,会导致似然比计算完全错误,这是本题最容易出错的点。

  2. 非减函数的判定边界
    MLR分布族仅要求似然比为非减函数,不要求严格增,本题中\(U(x_{(n)})\)的向上跳变、区间内恒值的情况,均满足非减的要求,符合MLR的定义。

  3. 统计量的充分性
    本题中\(T(x)=x_{(n)}\)是参数\(\theta\)的充分统计量,这也是MLR分布族的共性:MLR对应的统计量一定是参数的充分统计量,符合因子分解定理的结论。


四、拓展应用:对应单边检验的UMPT

既然该分布族是MLR分布族,根据单边检验的UMPT定理,对于最常用的检验问题:

\[H_0:\theta \leq \theta_0 \quad \longleftrightarrow \quad H_1:\theta > \theta_0 \]

其水平为\(\alpha\)的一致最优检验(UMPT)为:

\[\phi(x)= \begin{cases} 1, & x_{(n)} > c \\ r, & x_{(n)} = c \\ 0, & x_{(n)} < c \end{cases}\]

其中临界值\(c\)\(P_{\theta_0}(x_{(n)}>c) + rP_{\theta_0}(x_{(n)}=c) = \alpha\)确定。
\(x_{(n)}\)是连续型随机变量,\(P(x_{(n)}=c)=0\),无需随机化,最终拒绝域为\(x_{(n)} > \theta_0 \cdot (1-\alpha)^{1/n}\),这也是均匀分布参数单边检验的最优形式。


五、核心知识点汇总表

项目 核心内容 关键说明
分布类型 区间\((0,\theta)\)上的均匀分布\(R(0,\theta)\) 支撑集与参数\(\theta\)相关,非单参数指数族
样本联合密度 \(f(x,\theta) = \frac{1}{\theta^n} I\{x_{(1)}\geq0\} I\{x_{(n)}\leq\theta\}\) 核心化简依赖顺序统计量的等价关系
MLR对应的统计量 \(T(x) = x_{(n)}\)(样本最大值) 是参数\(\theta\)的充分统计量
似然比形式 \(\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot \frac{I\{x_{(n)}\leq\theta_1\}}{I\{x_{(n)}\leq\theta_0\}}\) 分段非减,随\(x_{(n)}\)增大而非减
核心结论 该分布族关于\(x_{(n)}\)为MLR分布族 是MLR分布族的经典非指数族案例
对应检验的UMPT 拒绝域为\(x_{(n)} > c\)\(c=\theta_0 \cdot (1-\alpha)^{1/n}\) 单边检验的一致最优检验,由MLR性质保证

MLR分布族单边检验的MPT与UMPT 完整讲解与严谨推导

作为数理统计领域深耕60余年的研究员,我将从前置核心定义→引理的严谨证明→NP引理与MLR的本质联系→三类检验的最优性证明→核心知识点归纳全链条,为你完整拆解这个假设检验的核心理论体系,所有推导均做到步骤无跳跃、逻辑可追溯。


一、前置核心定义回顾(所有推导的基础)

在正式讲解前,我们先明确4个贯穿始终的核心概念,确保推导逻辑的一致性:

  1. MLR分布族:单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}=h(T(x))\)是统计量\(T(x)\)非减函数,则称其为关于\(T(x)\)的单调似然比分布族。
  2. 检验函数\(\phi(x)\):随机化检验的通用形式,取值规则为:
    • \(\phi(x)=1\):拒绝原假设\(H_0\)
    • \(\phi(x)=0\):不拒绝原假设\(H_0\)
    • \(\phi(x)=\gamma\in(0,1)\):当\(T(x)=k\)时,以概率\(\gamma\)随机拒绝\(H_0\)(用于离散分布补足显著性水平)。
  3. 检验的水平与势
    • 水平\(\alpha\):原假设成立时,第一类错误概率的上界,即\(E_{\theta\in H_0}[\phi(X)] \leq \alpha\)
    • 势函数\(\beta(\theta)=E_\theta[\phi(X)]\):备择假设下,检验拒绝\(H_0\)的概率,势越大,检验的区分能力越强。
  4. MPT与UMPT
    • MPT(最优势检验):针对简单原假设↔简单备择假设,在所有水平为\(\alpha\)的检验中,备择假设下势最大的检验;
    • UMPT(一致最优检验):针对复合备择假设,在所有水平为\(\alpha\)的检验中,对备择假设空间内的每一个\(\theta\),都能达到最大势的检验(即对所有备择参数都是MPT)。
  5. Neyman-Pearson(NP)基本引理:简单vs简单检验问题中,水平为\(\alpha\)的检验\(\phi(x)\)是MPT的充要条件为:存在常数\(c\geq0\),使得

    \[\phi(x)= \begin{cases} 1, & \lambda(x) > c \\ \gamma, & \lambda(x) = c \\ 0, & \lambda(x) < c \end{cases}\]

    且满足\(E_{\theta_0}[\phi(X)]=\alpha\)

二、引理6.3.1的完整讲解与严谨证明

引理内容

对于MLR分布族,定义检验函数:

\[\phi^*(x) = \begin{cases} 1, & T(x) > k \\ \gamma, & T(x) = k \\ 0, & T(x) < k \end{cases} \tag{6.3.1}\]

则对任意给定的\(0<\alpha<1\),必存在常数\(k\)\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\)


完整证明

该引理的核心是:无论统计量\(T(X)\)是连续型还是离散型,都能找到对应的\(k\)\(\gamma\),使检验的第一类错误概率精确等于显著性水平\(\alpha\)

步骤1:定义\(T(X)\)在原假设下的分布函数

记原假设\(H_0:\theta=\theta_0\)下,统计量\(T(X)\)的累积分布函数(CDF)为:

\[F_0(t) = P_{\theta_0}(T(X) \leq t) \]

根据分布函数的通用性质,\(F_0(t)\)满足:非减、右连续,且\(F_0(-\infty)=0\)\(F_0(+\infty)=1\)

步骤2:将检验的期望转化为分布函数的形式

检验函数的期望(即原假设下的拒绝概率)为:

\[E_{\theta_0}[\phi^*(X)] = P_{\theta_0}(T(X) > k) + \gamma \cdot P_{\theta_0}(T(X) = k) \]

利用分布函数的性质,对两项分别变形:

  1. \(P_{\theta_0}(T(X) > k) = 1 - P_{\theta_0}(T(X) \leq k) = 1 - F_0(k)\)
  2. \(P_{\theta_0}(T(X) = k) = F_0(k) - F_0(k^-)\),其中\(F_0(k^-)=\lim_{t\to k^-}F_0(t)\)\(F_0(t)\)\(k\)点的左极限(跳跃高度)。

因此,期望可改写为:

\[1 - F_0(k) + \gamma \cdot \left[ F_0(k) - F_0(k^-) \right] = \alpha \tag{1} \]

步骤3:分情况证明\(k\)\(\gamma\)的存在性

我们分两种通用情况,证明总能找到满足条件的\(k\)\(\gamma\)

情况1:连续型统计量(无跳跃点)

\(T(X)\)是连续型随机变量,则\(F_0(t)\)是连续函数,\(P_{\theta_0}(T(X)=k)=0\)(即\(F_0(k)-F_0(k^-)=0\))。
此时式(1)简化为:

\[1 - F_0(k) = \alpha \implies F_0(k) = 1-\alpha \]

由于\(F_0(t)\)连续且严格非减,必然存在唯一的\(k=F_0^{-1}(1-\alpha)\),取\(\gamma=0\)即可满足\(E_{\theta_0}[\phi^*(X)]=\alpha\)

情况2:离散型统计量(存在跳跃点)

\(T(X)\)是离散型随机变量,\(F_0(t)\)存在跳跃点,可能不存在\(k\)使得\(F_0(k)=1-\alpha\)。此时必然存在唯一的\(k\),使得:

\[F_0(k^-) < 1-\alpha \leq F_0(k) \]

将该不等式变形,可得:

\[1 - F_0(k) < \alpha \leq 1 - F_0(k^-) \]

我们从式(1)中解出\(\gamma\)

\[\gamma = \frac{\alpha - \left[ 1 - F_0(k) \right]}{F_0(k) - F_0(k^-)} \]

结合上述不等式,可证明\(\gamma\in[0,1]\)

  • 分子:\(\alpha - (1-F_0(k)) \geq (1-F_0(k)) - (1-F_0(k)) = 0\)
  • 分母:\(F_0(k)-F_0(k^-)>0\),且\(\alpha \leq 1-F_0(k^-)\),因此分子\(\leq F_0(k)-F_0(k^-)\),即\(\gamma\leq1\)

因此,离散型场景下,也必然存在满足条件的\(k\)\(\gamma\)

最终结论

无论\(T(X)\)是连续型还是离散型,都存在\(k\)\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\),引理得证。


三、MLR分布族与NP引理的本质联系

引理给出的\(\phi^*(x)\)是基于统计量\(T(x)\)的阈值检验,而NP引理的最优检验是基于似然比\(\lambda(x)\)的阈值检验,二者的核心联系由MLR的单调性保证,下面我们严谨证明用户给出的两个核心包含关系。

核心前提

MLR分布族的似然比\(\lambda(x)=h(T(x))\)\(T(x)\)非减函数,记\(c=h(k)\),我们需要证明:

  1. \(\{T(x) > k\} \supset \{ \lambda(x) > c \}\)(即\(\lambda(x)>c \implies T(x)>k\)
  2. \(\{T(x) < k\} \supset \{ \lambda(x) < c \}\)(即\(\lambda(x)<c \implies T(x)<k\)

包含关系的严谨证明

1. 证明\(\{ \lambda(x) > c \} \subset \{ T(x) > k \}\)

反证法:假设存在样本\(x\),使得\(\lambda(x)>c\)\(T(x)\leq k\)
由于\(h(T(x))\)\(T(x)\)的非减函数,若\(T(x)\leq k\),则必有\(h(T(x))\leq h(k)\),即\(\lambda(x)\leq c\),与\(\lambda(x)>c\)的前提矛盾。
因此假设不成立,\(\lambda(x)>c\)必然推出\(T(x)>k\),包含关系得证。

2. 证明\(\{ \lambda(x) < c \} \subset \{ T(x) < k \}\)

反证法:假设存在样本\(x\),使得\(\lambda(x)<c\)\(T(x)\geq k\)
由于\(h(T(x))\)\(T(x)\)的非减函数,若\(T(x)\geq k\),则必有\(h(T(x))\geq h(k)\),即\(\lambda(x)\geq c\),与\(\lambda(x)<c\)的前提矛盾。
因此假设不成立,\(\lambda(x)<c\)必然推出\(T(x)<k\),包含关系得证。


核心推论

  1. \(h(T(x))\)\(T(x)\)严格增函数(MLR的特殊情况),则上述包含关系退化为等式\(\{T(x)>k\}=\{\lambda(x)>c\}\)\(\{T(x)<k\}=\{\lambda(x)<c\}\),此时\(\phi^*(x)\)与NP引理的最优检验形式完全一致。
  2. \(h(T(x))\)非减非严格增函数(MLR的一般情况),则\(\phi^*(x)\)与NP引理的最优检验,在\(\lambda(x)\neq c\)的区域取值完全一致,仅在\(\lambda(x)=c\)的边界区域可能存在差异,而这一差异不影响检验的最优性。

四、三类单边检验问题的最优性证明

我们依次证明\(\phi^*(x)\)是检验问题(i)的MPT、检验问题(ii)和(iii)的UMPT,三类检验问题的定义为:

  • (i) \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1 \ (\theta_1>\theta_0)\)(简单vs简单)
  • (ii) \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(简单vs复合单边)
  • (iii) \(H_0:\theta\leq\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(复合vs复合单边,最常用)

1. 证明\(\phi^*(x)\)是检验问题(i)的MPT

证明思路

根据NP引理,只要证明\(\phi^*(x)\)与NP引理给出的MPT具有完全相同的势,即可证明\(\phi^*(x)\)也是MPT。

完整证明

  1. 记NP引理给出的水平\(\alpha\)的MPT为\(\phi(x)\),其形式为:

    \[\phi(x)= \begin{cases} 1, & \lambda(x) > c \\ \gamma', & \lambda(x) = c \\ 0, & \lambda(x) < c \end{cases}\]

    满足\(E_{\theta_0}[\phi(X)]=\alpha\)

  2. 对比\(\phi^*(x)\)\(\phi(x)\)的取值:

    • \(\lambda(x)>c\)区域:该区域属于\(\{T(x)>k\}\),因此\(\phi^*(x)=1\),与\(\phi(x)\)取值完全一致;
    • \(\lambda(x)<c\)区域:该区域属于\(\{T(x)<k\}\),因此\(\phi^*(x)=0\),与\(\phi(x)\)取值完全一致;
    • 仅在\(\lambda(x)=c\)的边界区域,二者的随机化因子可能不同。
  3. 证明二者的势完全相等:
    检验的势为\(E_{\theta_1}[\phi(X)]\),将期望拆分为三个区域的积分:

    \[E_{\theta}[\phi(X)] = \int_{\lambda>c} \phi f(x,\theta)dx + \int_{\lambda=c} \phi f(x,\theta)dx + \int_{\lambda<c} \phi f(x,\theta)dx \]

    由于\(\lambda>c\)\(\lambda<c\)区域内\(\phi^*\)\(\phi\)取值一致,因此这两部分的积分完全相等,差异仅存在于\(\lambda=c\)的边界区域。

    \(\lambda=c\)区域,似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}=c\),因此\(f(x,\theta_1)=c\cdot f(x,\theta_0)\)。计算二者的势差:

    \[\Delta E_{\theta_1} = \int_{\lambda=c} [\phi^*(x)-\phi(x)] f(x,\theta_1)dx = c \cdot \int_{\lambda=c} [\phi^*(x)-\phi(x)] f(x,\theta_0)dx = c\cdot \Delta E_{\theta_0} \]

    \(\Delta E_{\theta_0}=E_{\theta_0}[\phi^*(X)] - E_{\theta_0}[\phi(X)] = \alpha-\alpha=0\),因此\(\Delta E_{\theta_1}=0\),即\(E_{\theta_1}[\phi^*(X)]=E_{\theta_1}[\phi(X)]\)

  4. 最终结论:\(\phi^*(x)\)与NP引理的MPT具有完全相同的势,因此\(\phi^*(x)\)也是检验问题(i)的MPT。


2. 证明\(\phi^*(x)\)是检验问题(ii)的UMPT

证明思路

UMPT的核心要求是:对备择假设中任意的\(\theta_1>\theta_0\)\(\phi^*(x)\)都是对应的简单vs简单检验的MPT。

完整证明

  1. 对任意固定的\(\theta_1>\theta_0\),根据上述证明,\(\phi^*(x)\)\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)的水平\(\alpha\)的MPT。
  2. 关键性质:\(\phi^*(x)\)的形式仅由\(\theta_0\)\(\alpha\)确定,与具体的\(\theta_1\)无关。也就是说,无论备择参数\(\theta_1\)取何值(只要\(\theta_1>\theta_0\)),\(\phi^*(x)\)都是对应的MPT。
  3. 根据UMPT的定义,\(\phi^*(x)\)对备择假设空间内的所有\(\theta\)都达到最大势,因此\(\phi^*(x)\)是检验问题(ii)的水平\(\alpha\)的UMPT。

3. 证明\(\phi^*(x)\)是检验问题(iii)的UMPT

这是实际应用最广泛的检验问题,证明分为两步:先证明\(\phi^*(x)\)满足水平要求,再证明其一致最优性。

前置引理:势函数的单调性

\(\phi^*(x)\)的势函数\(\beta(\theta)=E_\theta[\phi^*(X)]\)\(\theta\)非减函数
证明:对任意\(\theta_2>\theta_1\),似然比\(\lambda(x)=\frac{f(x,\theta_2)}{f(x,\theta_1)}\)\(T(x)\)的非减函数,\(\phi^*(x)\)也是\(T(x)\)的非减函数。根据切比雪夫关联不等式:两个非减函数的协方差非负,即

\[Cov(\phi^*(X), \lambda(X)) = E[\phi^*\lambda] - E[\phi^*]E[\lambda] \geq 0 \]

\(E[\lambda(X)] = \int \frac{f(x,\theta_2)}{f(x,\theta_1)} \cdot f(x,\theta_1)dx = 1\),因此:

\[E[\phi^*\lambda] = E_{\theta_2}[\phi^*(X)] = \beta(\theta_2) \geq E_{\theta_1}[\phi^*(X)] = \beta(\theta_1) \]

势函数的非减性得证。


步骤1:证明\(\phi^*(x)\)是水平\(\alpha\)的检验

复合原假设的水平要求是:对所有\(\theta\leq\theta_0\),都有\(E_\theta[\phi^*(X)] \leq \alpha\)
根据势函数的非减性,对任意\(\theta\leq\theta_0\),有:

\[\beta(\theta) = E_\theta[\phi^*(X)] \leq \beta(\theta_0) = \alpha \]

完全满足水平\(\alpha\)的要求。


步骤2:证明\(\phi^*(x)\)是UMPT

任取一个水平为\(\alpha\)的检验\(\phi'(x)\),即对所有\(\theta\leq\theta_0\),有\(E_\theta[\phi'(X)] \leq \alpha\)
对任意\(\theta_1>\theta_0\)\(\phi'(x)\)\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)的一个水平\(\leq\alpha\)的检验,而\(\phi^*(x)\)是该检验的水平\(\alpha\)的MPT,因此必有:

\[E_{\theta_1}[\phi^*(X)] \geq E_{\theta_1}[\phi'(X)] \]

由于\(\theta_1>\theta_0\)是任意的,因此\(\phi^*(x)\)对备择假设中所有的\(\theta\)都具有最大势,即\(\phi^*(x)\)是检验问题(iii)的水平\(\alpha\)的UMPT。


五、核心知识点归纳总结表

分类 核心内容 关键结论 核心理论依据
引理6.3.1 检验函数\(\phi^*(x)=\begin{cases}1, & T(x)>k \\ \gamma, & T(x)=k \\ 0, & T(x)<k\end{cases}\) 对任意\(0<\alpha<1\),必存在\(k\)\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\) 统计量分布函数的非减、右连续性质,随机化检验补足显著性水平
MLR与NP引理的联系 似然比\(\lambda(x)=h(T(x))\)\(T(x)\)的非减函数 1. \(\{\lambda(x)>c\} \subset \{T(x)>k\}\)
2. \(\{\lambda(x)<c\} \subset \{T(x)<k\}\)
3. 严格增时取等号
非减函数的单调性性质,反证法
检验问题(i):\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\) 简单vs简单单边检验 \(\phi^*(x)\)是该问题水平\(\alpha\)的MPT NP基本引理,似然比边界区域的势相等性
检验问题(ii):\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\) 简单vs复合单边检验 \(\phi^*(x)\)是该问题水平\(\alpha\)的UMPT \(\phi^*(x)\)的形式与备择参数\(\theta_1\)无关,对所有\(\theta>\theta_0\)都是MPT
检验问题(iii):\(H_0:\theta\leq\theta_0 \leftrightarrow H_1:\theta>\theta_0\) 复合vs复合单边检验 \(\phi^*(x)\)是该问题水平\(\alpha\)的UMPT 势函数的非减性(保证水平要求),对所有备择参数的MPT性质
势函数核心性质 \(\beta(\theta)=E_\theta[\phi^*(X)]\) 是参数\(\theta\)的非减函数 切比雪夫关联不等式,MLR的单调性
通用适用范围 所有MLR分布族 单边检验的UMPT一定存在,且形式为基于\(T(x)\)的阈值检验 MLR分布族的似然比单调性,NP引理的推广

理论闭环总结

NP引理解决了简单vs简单检验的最优性,而MLR分布族的核心价值,是将NP引理的最优性从单个备择参数推广到整个单边备择参数空间,最终得到了实际应用中最常用的复合单边检验的一致最优检验(UMPT)。这一理论体系是现代参数假设检验的核心基石,我们日常使用的Z检验、t检验、卡方检验、泊松检验的单边形式,其最优性均由该理论保证。


定理6.3.1与推论 完整讲解与严谨推导

一、定理6.3.1 核心内容与思想

定理陈述

设 ( X \sim {f(x,\theta), \theta \in \mathbb{R}} ) 为关于 ( T = T(x) ) 的MLR分布族,则由(6.3.1)定义的检验函数
[
\phi^*(x) =
\begin{cases}
1, & T(x) > k, \
\gamma, & T(x) = k, \
0, & T(x) < k,
\end{cases}
]
是假设检验问题

  • (i) ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 \ (\theta_1 > \theta_0) ) 的最优势检验(MPT)
  • (ii) ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta > \theta_0 ) 的一致最优检验(UMPT)

核心思想

MLR分布族的似然比 ( \lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = h(T(x)) ) 是 ( T(x) ) 的非减函数,这使得似然比阈值检验等价于统计量阈值检验,从而将Neyman-Pearson(NP)引理的最优性从“单个备择参数”推广到“整个单边备择参数空间”,最终得到复合单边检验的一致最优解。


二、定理6.3.1 详细证明过程

步骤1:集合分解(利用MLR单调性)

取 ( c = h(k) ),由于 ( h(t) ) 是非减函数,因此:

  • 当 ( T(x) > k ) 时,必有 ( h(T(x)) \geq h(k) = c ),即 ( \lambda(x) \geq c ),因此
    [
    {x: T(x) > k} = {x: T(x) > k, \lambda(x) > c} \cup {x: T(x) > k, \lambda(x) = c}.
    ]
  • 当 ( T(x) < k ) 时,必有 ( h(T(x)) \leq h(k) = c ),即 ( \lambda(x) \leq c ),因此
    [
    {x: T(x) < k} = {x: T(x) < k, \lambda(x) < c} \cup {x: T(x) < k, \lambda(x) = c}.
    ]

步骤2:重写 ( \phi^*(x) ) 为NP引理相容形式

根据集合分解,( \phi^(x) ) 可按似然比 ( \lambda(x) ) 重新表示为:
[
\phi^
(x) =
\begin{cases}
1, & \lambda(x) > c, \
\gamma^(x), & \lambda(x) = c, \
0, & \lambda(x) < c,
\end{cases}
]
其中分段函数 ( \gamma^
(x) ) 定义为:
[
\gamma^*(x) =
\begin{cases}
1, & T(x) > k, \lambda(x) = c, \
\gamma, & T(x) = k, \lambda(x) = c, \
0, & T(x) < k, \lambda(x) = c.
\end{cases}
]
这一形式与NP引理的最优势检验(MPT)结构完全一致:

  • ( \lambda(x) > c ):必然拒绝 ( H_0 )(( \phi^*(x)=1 ));
  • ( \lambda(x) < c ):必然不拒绝 ( H_0 )(( \phi^*(x)=0 ));
  • ( \lambda(x) = c ):根据 ( T(x) ) 的取值进行随机化决策。

步骤3:验证MPT性质

由引理6.3.1,( E_{\theta_0}[\phi^*(X)] = \alpha ),满足检验的水平要求。结合NP引理的唯一性条件:

  • 若一个检验满足NP引理的结构且达到水平 ( \alpha ),则它是该水平下的唯一MPT。
    因此 ( \phi^*(x) ) 是检验问题(i)的MPT。

步骤4:推广到UMPT

( \phi^*(x) ) 的形式仅由 ( \theta_0 ) 和 ( \alpha ) 确定,与备择参数 ( \theta_1 ) 无关。这意味着:

  • 对任意 ( \theta_1 > \theta_0 ),( \phi^*(x) ) 都是 ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 ) 的MPT;
  • 因此,对整个备择空间 ( \theta > \theta_0 ),( \phi^*(x) ) 都保持最优性,即它是检验问题(ii)的UMPT。

三、推论 内容与直观理解

推论陈述

任给 ( \alpha' ),设 ( E_{\theta'}[\phi^(X)] = \alpha' ),则 ( \phi^(x) ) 为以下检验 (i)'、(ii)' 水平为 ( \alpha' ) 的UMPT:

  • (i)' ( H_0: \theta = \theta' \longleftrightarrow H_1: \theta = \theta_1 ),但 ( \theta_1 > \theta' );
  • (ii)' ( H_0: \theta = \theta' \longleftrightarrow H_1: \theta > \theta' )。

核心解读

  1. 本质是参数平移:推论只是将原假设参数从 ( \theta_0 ) 替换为 ( \theta' ),证明逻辑与定理6.3.1完全一致——MLR分布族的单调性对任意 ( \theta' ) 都成立,因此 ( \phi^*(x) ) 的最优性可直接推广。
  2. 数学便利性:从观念上看,水平 ( \alpha ) 常与第一类错误联系,但数学上只需满足 ( 0 < \alpha < 1 ),无需固定 ( \alpha )。这使得我们可根据需要灵活选择 ( \alpha' )(如 ( \alpha' = 1-\alpha )),极大简化了后续推导。

四、核心知识点归纳总结表

模块 核心内容 关键结论 理论依据
定理6.3.1 MLR分布族下,统计量阈值检验 ( \phi^*(x) ) 的最优性 ( \phi^*(x) ) 是(i)的MPT,(ii)的UMPT MLR单调性 + NP引理 + 唯一性
集合分解 基于 ( h(t) ) 非减性拆分 ( {T(x) > k} ) 和 ( {T(x) < k} ) ( {T(x) > k} = {T(x) > k, \lambda > c} \cup {T(x) > k, \lambda = c} ) 非减函数的保序性
NP引理相容化 重写 ( \phi^*(x) ) 为似然比阈值形式 ( \phi^*(x) ) 满足NP引理的MPT结构 似然比与统计量的等价性
UMPT推广 ( \phi^*(x) ) 与备择参数 ( \theta_1 ) 无关 对所有 ( \theta > \theta_0 ),( \phi^*(x) ) 都是MPT 最优性的一致性
推论 原假设参数平移后的最优性 ( \phi^*(x) ) 是(i)'、(ii)' 的UMPT MLR性质的普适性 + 定理6.3.1的平移不变性
应用价值 为单边检验提供统一最优框架 日常使用的Z检验、t检验等单边形式的最优性均由此保证 从理论上支撑了经典检验方法的合理性

posted on 2026-03-03 08:08  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航