6.3单调似然比分布族的单边检验
单调似然比分布族的单边检验 完整讲解与推导
作为数理统计领域深耕多年的研究员,我将从背景起源→核心定义→定理推导→实例验证→归纳总结全链条,为你完整拆解这个假设检验的核心知识点。
一、背景引入:从NP引理的局限性到MLR的提出
Neyman-Pearson(NP)基本引理是假设检验的基石,它完美解决了简单原假设 ↔ 简单备择假设的最优势(MP)检验问题,给出了似然比检验的最优形式:
其中\(c\)由显著性水平\(\alpha\)确定,保证\(P_{\theta_0}(\lambda(X)\geq c)=\alpha\)。
但NP引理的应用存在严格限制:它仅能处理两个单点参数的检验问题,而实际科研与工程中,我们几乎都面对复合假设检验,最典型的三类单边检验问题为:
- \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1 \ (\theta_1>\theta_0)\)(简单vs简单,NP引理可解)
- \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(简单vs复合单边)
- \(H_0:\theta\leq\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(复合vs复合单边,最常用)
对于复合假设,我们需要找到一致最优检验(UMPT):即一个水平为\(\alpha\)的检验,对备择假设中所有的\(\theta\),它都是该水平下的MP检验。
要让NP引理的最优性从“单个\(\theta_1\)”推广到“所有\(\theta>\theta_0\)”,就需要分布族满足一个核心性质——单调似然比(MLR)性质,这也是本节内容的核心。
二、单调似然比(MLR)分布族 定义详解
2.1 正式定义
设单参数分布族\(\{f(x,\theta),\theta\in\Theta\subset\mathbb{R}\}\),\(f(x,\theta)\)为总体的概率密度(连续型)或分布律(离散型),若满足以下两个条件:
- 可识别性条件:当\(\theta_1\neq\theta_2\)时,集合\(\{x:f(x,\theta_1)\neq f(x,\theta_2)\}\)的测度大于0。
(含义:不同参数对应不同的分布,否则假设检验无意义,无法区分参数) - 似然比单调性条件:对任意\(\theta_1>\theta_0\),似然比\[\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)} \]是统计量\(T=T(x)\)的非减函数,即:若\(T(x_1)\geq T(x_2)\),则\(\lambda(x_1)\geq\lambda(x_2)\)。
则称该分布族关于统计量\(T=T(x)\)为单调似然比分布族,简称MLR分布族。
2.2 定义的核心解读
- 非减而非严增:定义仅要求似然比随\(T(x)\)非减,而非严格递增,这大幅放宽了适用范围,覆盖了绝大多数常用的参数分布族。
- 核心直觉:似然比\(\lambda(x)\)的含义是“观测到\(x\)时,样本来自\(\theta_1\)的可能性/来自\(\theta_0\)的可能性”。MLR性质说明:\(T(x)\)越大,样本来自更大参数\(\theta\)的可能性越高,也就是越支持备择假设\(H_1:\theta>\theta_0\)。
- 最优检验的形式统一:正因为似然比的单调性,\(\lambda(x)\geq c\)(NP引理的拒绝域)可以等价转化为\(T(x)\geq c\),这个形式不依赖于具体的\(\theta_1\),只和\(T(x)\)有关,这是UMPT存在的核心前提。
2.3 典型MLR分布族验证(实例)
绝大多数常用的单参数分布都属于MLR分布族,且均为单参数指数型分布族,这里给出核心验证:
例1:伯努利分布族\(B(1,p)\)
分布律:\(f(x,p)=p^x(1-p)^{1-x},x\in\{0,1\},p\in(0,1)\)
任取\(p_1>p_0\),似然比:
因\(p_1>p_0\),故\(\frac{p_1(1-p_0)}{p_0(1-p_1)}>1\),\(\lambda(x)\)是\(x\)的严增函数,因此该分布族关于\(T(x)=x\)是MLR分布族。
例2:正态分布族\(N(\mu,1)\)(方差已知)
密度函数:\(f(x,\mu)=\frac{1}{\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2}\right\},\mu\in\mathbb{R}\)
任取\(\mu_1>\mu_0\),似然比:
因\(\mu_1-\mu_0>0\),\(\lambda(x)\)是\(x\)的严增函数,因此该分布族关于\(T(x)=x\)是MLR分布族。
例3:单参数指数型分布族的通用结论
单参数指数型分布族的标准形式为:
若\(Q(\theta)\)是\(\theta\)的严格单调函数,则该分布族一定是MLR分布族:
- \(Q(\theta)\)严增:似然比是\(T(x)\)的严增函数,关于\(T(x)\)为MLR分布族;
- \(Q(\theta)\)严减:似然比是\(-T(x)\)的严增函数,关于\(-T(x)\)为MLR分布族。
三、MLR分布族单边检验的核心定理与完整证明
我们分两步给出核心定理:先解决简单原假设vs复合备择的UMPT,再推广到最常用的复合原假设vs复合备择的场景。
3.1 定理1:简单原假设的单边UMPT
定理内容
设单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\)关于统计量\(T=T(x)\)是MLR分布族,对于检验问题
则水平为\(\alpha\)的UMPT存在,且检验函数(拒绝规则)为:
其中常数\(c\)和\(r(0\leq r\leq1)\)由显著性水平\(\alpha\)确定,满足:
同时,该检验的势函数\(\beta(\theta)=E_\theta[\phi(X)]\)是\(\theta\)的非减函数。
完整证明
证明分为两部分:1. 证明\(\phi(x)\)是UMPT;2. 证明势函数的单调性
第一部分:证明\(\phi(x)\)是该检验问题的UMPT
-
任取一个固定的\(\theta_1>\theta_0\),考虑简单vs简单的检验问题\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)。
根据NP引理,该问题水平为\(\alpha\)的MP检验,拒绝域为似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)} \geq k\),其中\(k\)满足\(P_{\theta_0}(\lambda(X)\geq k)=\alpha\)。 -
由MLR分布族的定义,\(\theta_1>\theta_0\)时,\(\lambda(x)\)是\(T(x)\)的非减函数,因此有等价关系:
\[\lambda(x) \geq k \quad \Longleftrightarrow \quad T(x) \geq c \]其中\(c\)是与\(k\)对应的常数:
- 连续型分布:\(T(x)\)是连续随机变量,\(P(T(x)=c)=0\),无需随机化,\(r=0\),拒绝域为\(T(x)>c\);
- 离散型分布:\(T(x)\)是离散随机变量,\(P(T(x)\geq c)\)可能无法恰好等于\(\alpha\),因此在\(T(x)=c\)处引入随机化因子\(r\),补足显著性水平。
-
关键结论:上述等价关系中,\(c\)和\(r\)仅由\(\theta_0\)和\(\alpha\)确定,与具体的\(\theta_1\)无关。
也就是说,对于任意的\(\theta_1>\theta_0\),该检验\(\phi(x)\)都是水平为\(\alpha\)的MP检验。根据UMPT的定义,\(\phi(x)\)就是该检验问题水平为\(\alpha\)的UMPT。
第二部分:证明势函数\(\beta(\theta)=E_\theta[\phi(X)]\)是\(\theta\)的非减函数
要证:对任意\(\theta_2>\theta_1\),有\(\beta(\theta_2)\geq\beta(\theta_1)\)。
-
考虑检验问题\(H_0':\theta=\theta_1 \leftrightarrow H_1':\theta=\theta_2\),\(\theta_2>\theta_1\)。由MLR性质,该问题的水平为\(\alpha'=\beta(\theta_1)\)的MP检验,形式同样为\(\phi(x)\)。
-
根据NP引理的核心结论:任何MP检验在备择假设下的势,一定不小于检验的水平,即:
\[E_{\theta_2}[\phi(X)] \geq E_{\theta_1}[\phi(X)] \]也就是\(\beta(\theta_2)\geq\beta(\theta_1)\),得证。
补充严谨推导(协方差不等式法):
\(\phi(x)\)是\(T(x)\)的非减函数,\(\lambda(x)=\frac{f(x,\theta_2)}{f(x,\theta_1)}\)也是\(T(x)\)的非减函数,根据切比雪夫协方差不等式:两个非减函数的协方差非负,即\[Cov_{\theta_1}(\phi(X),\lambda(X)) = E_{\theta_1}[\phi(X)\lambda(X)] - E_{\theta_1}[\phi(X)]E_{\theta_1}[\lambda(X)] \geq 0 \]而\(E_{\theta_1}[\lambda(X)] = \int \frac{f(x,\theta_2)}{f(x,\theta_1)} \cdot f(x,\theta_1) dx = 1\),因此
\[E_{\theta_1}[\phi(X)\lambda(X)] = E_{\theta_2}[\phi(X)] = \beta(\theta_2) \geq E_{\theta_1}[\phi(X)] = \beta(\theta_1) \]
3.2 定理2:复合原假设的单边UMPT
定理内容
在定理1的MLR分布族条件下,对于最常用的检验问题
定理1给出的检验函数\(\phi(x)\),同样是该问题水平为\(\alpha\)的UMPT。
完整证明
复合原假设的检验,对水平的要求是:对所有\(\theta\in H_0\)(即\(\theta\leq\theta_0\)),都有\(E_\theta[\phi(X)] \leq \alpha\),即势函数在原假设参数空间上的上确界不超过\(\alpha\)。证明分为两步:
-
证明\(\phi(x)\)是该问题水平为\(\alpha\)的检验
由定理1,我们已经证明\(\beta(\theta)=E_\theta[\phi(X)]\)是\(\theta\)的非减函数。因此,对所有\(\theta\leq\theta_0\),有:\[\beta(\theta) \leq \beta(\theta_0) = \alpha \]完全满足水平为\(\alpha\)的检验的要求。
-
证明\(\phi(x)\)是该问题的UMPT
任取一个水平为\(\alpha\)的检验\(\phi'(x)\),即对所有\(\theta\leq\theta_0\),有\(E_\theta[\phi'(X)] \leq \alpha\)。
对任意的\(\theta_1>\theta_0\),考虑简单vs简单的检验问题\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\):- \(\phi(x)\)是该问题水平为\(\alpha\)的MP检验;
- \(\phi'(x)\)是该问题的一个水平\(\leq\alpha\)的检验(因\(E_{\theta_0}[\phi'(X)] \leq \alpha\))。
根据NP引理,MP检验的势是所有同水平检验中最大的,因此:
\[E_{\theta_1}[\phi(X)] \geq E_{\theta_1}[\phi'(X)] \]由于\(\theta_1>\theta_0\)是任意的,因此\(\phi(x)\)对备择假设中所有的\(\theta\),都具有最大的势,即\(\phi(x)\)是该检验问题水平为\(\alpha\)的UMPT。
3.3 对称结论:左侧单边检验的UMPT
对于左侧单边检验问题
基于MLR分布族的对称性,水平为\(\alpha\)的UMPT为:
其中\(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\),证明过程与右侧检验完全对称,核心是\(\theta_1<\theta_0\)时,似然比随\(T(x)\)减小而增大,因此拒绝域为\(T(x)<c\)。
四、完整实例:正态总体均值的单边UMPT
设\(X_1,X_2,\dots,X_n\)是来自正态总体\(N(\mu,1)\)的独立同分布样本,求检验问题\(H_0:\mu\leq0 \leftrightarrow H_1:\mu>0\)的水平为\(\alpha\)的UMPT。
步骤1:验证MLR性质
样本联合密度为:
任取\(\mu_1>\mu_0\),似然比:
因\(\mu_1-\mu_0>0\),\(\lambda(x)\)是\(\bar{x}\)的严增函数,因此该分布族关于\(T(x)=\bar{x}\)是MLR分布族。
步骤2:确定UMPT的形式
根据定理2,UMPT的形式为:
(正态分布为连续型,无需随机化,\(r=0\))
步骤3:确定临界值\(c\)
由\(E_{\mu=0}[\phi(X)]=\alpha\),即\(P_{\mu=0}(\bar{X}>c)=\alpha\)。
当\(\mu=0\)时,\(\bar{X} \sim N(0,1/n)\),因此\(\sqrt{n}\bar{X} \sim N(0,1)\),则:
其中\(\Phi(\cdot)\)为标准正态分布的分布函数,因此\(\Phi(\sqrt{n}c)=1-\alpha\),得\(\sqrt{n}c=z_{1-\alpha}\),即\(c=\frac{z_{1-\alpha}}{\sqrt{n}}\)(\(z_{1-\alpha}\)为标准正态分布的\(1-\alpha\)分位数)。
最终结论
该检验问题的水平为\(\alpha\)的UMPT为:当样本均值\(\bar{X} > \frac{z_{1-\alpha}}{\sqrt{n}}\)时拒绝原假设\(H_0\),否则不拒绝\(H_0\),这与我们常用的单边Z检验完全一致,也验证了常用单边检验的最优性。
五、知识点归纳总结表
| 分类 | 核心内容 | 关键性质/条件 | 补充说明 |
|---|---|---|---|
| 单调似然比(MLR)分布族定义 | 单参数分布族\(f(x,\theta)\)满足: 1. 可识别性:\(\theta_1≠\theta_2\)时,\(\mu\{f(x,\theta_1)≠f(x,\theta_2)\}>0\) 2. 似然比单调性:\(\theta_1>\theta_0\)时,\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)是\(T(x)\)的非减函数 |
1. 仅要求似然比非减,不要求严增,覆盖范围更广 2. 核心逻辑:\(T(x)\)越大,越支持\(\theta\)更大的备择假设 |
单参数指数型分布族天然满足MLR性质,是最常见的MLR分布族来源 |
| 简单原假设右侧单边检验UMPT (\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\)) |
水平为\(\alpha\)的UMPT检验函数: $$\phi(x)=\begin{cases}1, & T(x)>c \ r, & T(x)=c \ 0, & T(x)<c\end{cases}$$ \(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\) |
1. 检验形式仅由\(T(x)\)决定,与备择假设的具体\(\theta_1\)无关 2. 对所有\(\theta>\theta_0\),均为最优势检验 |
连续型分布无需随机化,\(r=0\);离散型分布用\(r\)补足显著性水平 |
| 复合原假设右侧单边检验UMPT (\(H_0:\theta≤\theta_0 \leftrightarrow H_1:\theta>\theta_0\)) |
上述\(\phi(x)\)同样是该问题水平为\(\alpha\)的UMPT | 1. 势函数\(\beta(\theta)\)是\(\theta\)的非减函数 2. 原假设上\(\beta(\theta)≤\beta(\theta_0)=\alpha\),满足水平要求 |
实际应用最广泛的形式,常用的Z检验、t检验、泊松分布检验的单边形式均属于此类 |
| 左侧单边检验UMPT (\(H_0:\theta≥\theta_0 \leftrightarrow H_1:\theta<\theta_0\)) |
水平为\(\alpha\)的UMPT检验函数: $$\phi(x)=\begin{cases}1, & T(x)<c \ r, & T(x)=c \ 0, & T(x)>c\end{cases}$$ \(c,r\)满足\(E_{\theta_0}[\phi(X)]=\alpha\) |
与右侧检验对称,似然比随\(T(x)\)减小而增大,拒绝域为\(T(x)<c\) | 势函数仍为\(\theta\)的非减函数,保证原假设上的水平约束 |
| MLR分布族势函数性质 | 检验的势函数\(\beta(\theta)=E_\theta[\phi(X)]\)是\(\theta\)的非减函数 | 1. 复合原假设的检验水平在\(\theta=\theta_0\)处达到最大值 2. 备择假设中,\(\theta\)离\(\theta_0\)越远,检验的势越高,检验效果越好 |
是复合原假设检验满足水平要求的核心依据 |
| 常见MLR分布族与对应统计量\(T(x)\) | 1. 伯努利分布\(B(1,p)\):\(T(x)=\sum_{i=1}^n x_i\) 2. 泊松分布\(P(\lambda)\):\(T(x)=\sum_{i=1}^n x_i\) 3. 正态分布\(N(\mu,\sigma^2)\)(\(\sigma^2\)已知):\(T(x)=\bar{x}\) 4. 指数分布\(Exp(\beta)\):\(T(x)=-\sum_{i=1}^n x_i\) |
均属于单参数指数型分布族,天然满足MLR性质 | 多参数分布族固定冗余参数后,单参数部分仍可满足MLR性质 |
核心逻辑闭环
NP引理解决了简单vs简单的最优检验 → MLR性质保证了所有备择假设下的MP检验形式统一为\(T(x)\geq c\) → 得到简单原假设单边检验的UMPT → 势函数的单调性保证了复合原假设下的水平约束,最终得到了实际中最常用的复合单边检验的UMPT。这也是现代参数假设检验的核心理论基础。
习题讲解
例题完整讲解与全分布推导验证
本题的核心是验证三类经典单参数分布族均为单调似然比(MLR)分布族,我会先拆解例题中两点分布的推导细节,再补全例题提及的正态分布、泊松分布的完整验证,最后总结核心规律。
一、先回顾MLR分布族的核心定义
对于单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若满足:
- 可识别性:\(\theta_1\neq\theta_2\)时,不同参数对应分布有差异;
- 单调性:对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)是统计量\(T(x)\)的非减(增)函数。
则称该分布族关于\(T(x)\)为MLR分布族,这是单边假设检验存在一致最优检验(UMPT)的核心前提。
二、两点分布(伯努利分布)\(b(1,\theta)\)的MLR完整验证
1. 样本联合分布推导
设\(X_1,X_2,\dots,X_n\)独立同分布,均服从参数为\(\theta\)的两点分布,单个样本的分布律为:
\(n\)个独立样本的联合分布律(似然函数)为各样本分布的乘积:
对式子化简:
- 记充分统计量\(T=T(x)=\sum_{i=1}^n x_i\)(样本中取值为1的总个数);
- \(\theta\)的幂次合并为\(\theta^{\sum_{i=1}^n x_i}=\theta^T\);
- \((1-\theta)\)的幂次合并为\((1-\theta)^{\sum_{i=1}^n (1-x_i)}=(1-\theta)^{n-T}\)。
最终得到联合分布的简洁形式:
2. 似然比计算与单调性验证
任取\(\theta_1>\theta_0\)(\(\theta_1,\theta_0\in(0,1)\)),计算似然比:
将式子重组,把含\(T\)的项与常数项拆分:
单调性分析:
- 因\(\theta_1>\theta_0\),故\(\frac{\theta_1}{\theta_0}>1\)、\(\frac{1-\theta_0}{1-\theta_1}>1\),因此底数\(\frac{\theta_1(1-\theta_0)}{\theta_0(1-\theta_1)}>1\);
- 指数函数\(a^T\)当\(a>1\)时,是关于\(T\)的严格增函数;\(\left( \frac{1-\theta_1}{1-\theta_0} \right)^n\)是与样本无关的常数,不影响单调性。
因此,似然比\(\lambda(x)\)是\(T(x)=\sum_{i=1}^n x_i\)的严格增函数,完全满足MLR分布族的定义。
三、正态分布\(N(0,\sigma^2)\)的MLR完整验证(例题提及,补全推导)
1. 样本联合分布推导
设\(X_1,X_2,\dots,X_n\)独立同分布,均服从均值为0、方差为\(\sigma^2\)的正态分布,单个样本的概率密度为:
\(n\)个独立样本的联合密度为:
化简后:
2. 似然比计算与单调性验证
取单参数\(\theta=\sigma^2\),任取\(\sigma_1^2 > \sigma_0^2>0\),计算似然比:
单调性分析:
- 因\(\sigma_1^2>\sigma_0^2\),故\(\frac{1}{\sigma_0^2} - \frac{1}{\sigma_1^2} > 0\),指数部分为关于\(T(x)\)的正系数线性项;
- 指数函数\(\exp\{k\cdot T(x)\}\)当\(k>0\)时,是关于\(T(x)\)的严格增函数,常数项不影响单调性。
因此,该正态分布族关于\(T(x)=\sum_{i=1}^n x_i^2\)是MLR分布族。
四、泊松分布\(P(\lambda)\)的MLR完整验证(例题提及,补全推导)
1. 样本联合分布推导
设\(X_1,X_2,\dots,X_n\)独立同分布,均服从参数为\(\lambda\)的泊松分布,单个样本的分布律为:
\(n\)个独立样本的联合分布律为:
化简后:
2. 似然比计算与单调性验证
任取\(\lambda_1>\lambda_0>0\),计算似然比(与样本无关的常数项直接约去):
单调性分析:
- 因\(\lambda_1>\lambda_0\),故底数\(\frac{\lambda_1}{\lambda_0}>1\),\(\left( \frac{\lambda_1}{\lambda_0} \right)^{T(x)}\)是关于\(T(x)\)的严格增函数;
- 常数项\(e^{-n(\lambda_1-\lambda_0)}\)不影响单调性。
因此,泊松分布族关于\(T(x)=\sum_{i=1}^n x_i\)是MLR分布族。
五、核心规律与汇总表
1. 本质共性
这三类分布均属于单参数指数型分布族,其标准形式为:
只要\(Q(\theta)\)是\(\theta\)的严格单调函数,该分布族就一定是MLR分布族,这也是三类分布天然满足MLR性质的根本原因。
2. 三类分布核心信息汇总
| 分布类型 | 单参数 | 充分统计量\(T(x)\) | 似然比单调性 | MLR核心依据 |
|---|---|---|---|---|
| 两点分布\(b(1,\theta)\) | 成功概率\(\theta\in(0,1)\) | \(\sum_{i=1}^n x_i\) | 关于\(T(x)\)严格增 | \(Q(\theta)=\ln\frac{\theta}{1-\theta}\)是\(\theta\)的严格增函数 |
| 正态分布\(N(0,\sigma^2)\) | 方差\(\sigma^2>0\) | \(\sum_{i=1}^n x_i^2\) | 关于\(T(x)\)严格增 | \(Q(\theta)=-\frac{1}{2\sigma^2}\)是\(\sigma^2\)的严格增函数 |
| 泊松分布\(P(\lambda)\) | 强度\(\lambda>0\) | \(\sum_{i=1}^n x_i\) | 关于\(T(x)\)严格增 | \(Q(\theta)=\ln\lambda\)是\(\lambda\)的严格增函数 |
3. 应用价值
验证这三类分布的MLR性质后,可直接套用单边检验的UMPT定理,得到对应参数单边检验的一致最优检验,这也是日常使用的比例检验、方差单边检验、泊松计数检验的理论最优性依据。
单参数指数族MLR性质 完整讲解与深度推导
本题是单调似然比(MLR)分布族最核心的通用结论:所有满足自然参数单调的单参数指数族,天然是MLR分布族。此前的伯努利、泊松、正态分布均是该通用结论的特例,下面我将从前置定义、完整推导、细节解读、拓展补充四个维度,完整拆解这个知识点。
一、前置核心定义回顾
1. 单参数指数型分布族的标准形式
本题给出的是单参数指数族的标准正则形式:
各符号的含义与约束:
- \(h(x) \geq 0\):仅与样本\(x\)有关的非负函数,与参数\(\theta\)无关;
- \(T(x)\):样本的充分统计量(由因子分解定理可直接证明);
- \(Q(\theta)\):仅与参数\(\theta\)有关的函数,称为自然参数,是决定单调性的核心;
- \(b(\theta)\):仅与参数\(\theta\)有关的累积量生成函数,作用是保证密度/分布律的积分为1,满足正则性条件;
- 可识别性:当\(\theta_1 \neq \theta_2\)时,\(\mu\{f(x,\theta_1)\neq f(x,\theta_2)\}>0\),即不同参数对应不同分布,是MLR定义的前提条件。
2. MLR分布族的核心定义
对于单参数分布族\(\{f(x,\theta), \theta\in\Theta\}\),若对任意\(\theta_1 > \theta_0\),似然比
是统计量\(T(x)\)的非减(增)函数,则称该分布族关于\(T(x)\)为单调似然比分布族(MLR分布族)。
二、完整推导与单调性证明
步骤1:写出似然比的完整表达式
任取\(\theta_1 > \theta_0\),将指数族形式代入似然比定义:
步骤2:化简似然比
- 分子分母的\(h(x)\)完全相同,且与参数\(\theta\)无关,直接约去,不影响似然比的单调性;
- 利用指数运算性质\(\frac{\exp(A)}{\exp(B)} = \exp(A-B)\),将分式转化为单指数形式:
步骤3:整理指数项,拆分核心变量与常数项
将含\(T(x)\)的项合并,与样本无关的常数项分离:
步骤4:严格证明单调性
本题给出核心条件:\(Q(\theta)\)是\(\theta\)的增函数,结合\(\theta_1 > \theta_0\),可直接得到:
即系数\(k>0\),由此可分两步证明单调性:
- 指数内的核心项\(k\cdot T(x) - C\):\(k>0\),因此该项是\(T(x)\)的严格增函数,常数项\(C\)不改变单调性;
- 外层的指数函数\(\exp(\cdot)\)是定义域上的严格增函数,严格增函数的复合仍为严格增函数。
因此,整个似然比\(\lambda(x)\)是\(T(x)\)的严格增函数,完全满足MLR分布族的定义,该单参数指数族是关于\(T(x)\)的MLR分布族。
三、关键细节拓展与补充
1. 对称情况:\(Q(\theta)\)为\(\theta\)的严格减函数
若\(Q(\theta)\)是\(\theta\)的严格减函数,则当\(\theta_1 > \theta_0\)时,\(Q(\theta_1)-Q(\theta_0) < 0\),此时:
- 似然比\(\lambda(x)\)是\(T(x)\)的严格减函数;
- 等价于\(\lambda(x)\)是\(-T(x)\)的严格增函数,因此该分布族关于\(-T(x)\)是MLR分布族。
示例:指数分布\(Exp(\lambda)\),密度为\(f(x,\lambda)=\lambda e^{-\lambda x}(x>0)\),写成指数族形式为:
其中\(Q(\lambda)=-\lambda\)是\(\lambda\)的严格减函数,\(T(x)=x\),因此该分布族关于\(-T(x)=-x\)是MLR分布族。
2. 该结论的核心价值
这个通用结论是MLR分布族的最核心充分条件,几乎所有常用的单参数分布(伯努利、二项、泊松、正态、指数、伽马、几何分布等)都属于单参数指数族,只需验证\(Q(\theta)\)的单调性,即可直接判断MLR性质,无需每次重新计算似然比,大幅简化了单边检验UMPT的求解过程。
3. 与前序例题的对应关系
此前验证的三类分布,均是该通用结论的特例:
| 分布类型 | 指数族形式的\(Q(\theta)\) | \(Q(\theta)\)的单调性 | MLR对应的统计量\(T(x)\) |
|---|---|---|---|
| 伯努利分布\(b(1,\theta)\) | \(\ln\left( \frac{\theta}{1-\theta} \right)\) | 严格增 | \(\sum_{i=1}^n x_i\) |
| 泊松分布\(P(\lambda)\) | \(\ln\lambda\) | 严格增 | \(\sum_{i=1}^n x_i\) |
| 正态分布\(N(0,\sigma^2)\) | \(-\frac{1}{2\sigma^2}\) | 严格增 | \(\sum_{i=1}^n x_i^2\) |
四、核心结论总结
- 通用定理:正则单参数指数族\(f(x,\theta) = h(x)\exp\left\{ Q(\theta)T(x) - b(\theta) \right\}\),若\(Q(\theta)\)是\(\theta\)的严格单调函数,则该分布族一定是MLR分布族。
- 单调性对应规则:
- \(Q(\theta)\)严格增 → 关于\(T(x)\)为MLR分布族;
- \(Q(\theta)\)严格减 → 关于\(-T(x)\)为MLR分布族。
- 应用延伸:满足该性质的分布族,其单边假设检验一定存在一致最优检验(UMPT),检验形式可直接由\(T(x)\)的阈值确定,是参数假设检验的核心理论基础。
均匀分布R(0,θ)的MLR分布族验证 完整讲解与深度推导
本题是单调似然比(MLR)分布族的经典非指数族案例,和此前的指数族例子形成关键区分,我将从前置概念、分步推导、细节解读、核心拓展四个维度,完整拆解这个知识点。
一、前置核心概念回顾
1. 基础分布与符号说明
- 均匀分布\(R(0,\theta)\)(也记\(U(0,\theta)\)):区间\((0,\theta)\)上的连续均匀分布,单个样本\(X_1\)的概率密度为:\[f(x_1,\theta) = \frac{1}{\theta} I\{0 \leq x_1 \leq \theta\}, \quad \theta>0 \]其中\(I\{A\}\)为指示函数:事件\(A\)发生时取1,不发生时取0,是本例题的核心化简工具。
- 顺序统计量:对\(n\)个独立样本\(X_1,X_2,\dots,X_n\),记
- \(x_{(1)} = \min\{X_1,X_2,\dots,X_n\}\)(样本最小值)
- \(x_{(n)} = \max\{X_1,X_2,\dots,X_n\}\)(样本最大值)
核心等价关系:所有样本满足\(0\leq X_i \leq \theta\),当且仅当\(x_{(1)}\geq0\)且\(x_{(n)}\leq\theta\)。
- MLR分布族定义:对单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}\)是统计量\(T(x)\)的非减函数,则称该分布族关于\(T(x)\)为MLR分布族。
2. 本例题的特殊性
均匀分布\(R(0,\theta)\)的支撑集(密度非零的区域)与参数\(\theta\)相关,不属于单参数指数族,是MLR分布族的典型非指数族案例,证明了MLR分布族的覆盖范围比单参数指数族更广。
二、完整分步推导与证明
步骤1:推导样本的联合概率密度
设\(X_1,X_2,\dots,X_n\)独立同分布于\(R(0,\theta)\),独立样本的联合密度为单个样本密度的乘积:
对式子进行拆分化简:
- 常数项:\(\prod_{i=1}^n \frac{1}{\theta} = \frac{1}{\theta^n}\);
- 指示函数项:\(\prod_{i=1}^n I\{0 \leq x_i \leq \theta\}\),根据顺序统计量的等价关系,所有样本满足\(0\leq x_i\leq\theta\),等价于最小值非负、最大值不超过\(\theta\),因此:\[\prod_{i=1}^n I\{0 \leq x_i \leq \theta\} = I\{x_{(1)}\geq0\} \cdot I\{x_{(n)}\leq\theta\} \]
最终得到联合密度的简洁形式:
步骤2:计算似然比\(\lambda(x)\)
任取\(\theta_1>\theta_0>0\),根据似然比定义,代入联合密度:
化简规则:
- 仅考虑分布的支撑集(密度非零区域),即\(I\{x_{(1)}\geq0\}=1\),分子分母的该项可直接约去;
- 常数项合并为\(\left( \frac{\theta_0}{\theta_1} \right)^n\),因\(\theta_1>\theta_0>0\),该项为正的常数。
最终化简为:
步骤3:分段分析似然比的核心项\(U(x_{(n)})\)
记\(U(x_{(n)}) = \frac{I\{x_{(n)}\leq\theta_1\}}{I\{x_{(n)}\leq\theta_0\}}\),结合\(\theta_1>\theta_0\)的前提,对\(x_{(n)}\geq0\)分区间讨论:
-
区间1:\(0 \leq x_{(n)} \leq \theta_0\)
\(x_{(n)}\leq\theta_0\)自然满足\(x_{(n)}\leq\theta_1\),因此分子\(I\{x_{(n)}\leq\theta_1\}=1\),分母\(I\{x_{(n)}\leq\theta_0\}=1\),得\(U(x_{(n)})=1\)。 -
区间2:\(\theta_0 < x_{(n)} \leq \theta_1\)
\(x_{(n)}>\theta_0\),分母\(I\{x_{(n)}\leq\theta_0\}=0\);\(x_{(n)}\leq\theta_1\),分子\(I\{x_{(n)}\leq\theta_1\}=1\),因此\(U(x_{(n)})=+\infty\)(表示似然比趋于无穷,样本来自\(\theta_1\)的可能性远大于\(\theta_0\))。 -
区间3:\(x_{(n)} > \theta_1\)
分子分母的指示函数均为0,属于两个分布的支撑集之外,无统计意义,无需讨论。
因此\(U(x_{(n)})\)的分段形式为:
步骤4:证明似然比的单调性,验证MLR性质
-
证明\(U(x_{(n)})\)是\(x_{(n)}\)的非减函数
非减函数的定义:若\(x_1 \leq x_2\),则\(g(x_1) \leq g(x_2)\)。- 当\(x_{(n)}\)从0增加到\(\theta_0\)时,\(U(x_{(n)})\)恒为1,满足非减;
- 当\(x_{(n)}\)超过\(\theta_0\)进入\((\theta_0,\theta_1]\)区间时,\(U(x_{(n)})\)从1跳变到\(+\infty\),是向上跳变,仍满足非减。
因此\(U(x_{(n)})\)是\(x_{(n)}\)的非减函数。
-
证明\(\lambda(x)\)是\(x_{(n)}\)的非减函数
似然比\(\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot U(x_{(n)})\),其中\(\left( \frac{\theta_0}{\theta_1} \right)^n\)是正的常数。
正的常数乘以非减函数,结果仍为非减函数;且\(\lambda(x)\)是\(U(x_{(n)})\)的严格增一次函数,复合后\(\lambda(x)\)是\(x_{(n)}\)的非减函数。 -
最终结论
对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)\)是\(T(x)=x_{(n)}\)的非减函数,完全符合MLR分布族的定义,因此该分布族关于\(T(x)=x_{(n)}\)为MLR分布族。
三、关键细节与易错点解读
-
指示函数的核心作用
均匀分布的支撑集与参数相关,必须通过指示函数明确密度非零的区域,若直接忽略指示函数,会导致似然比计算完全错误,这是本题最容易出错的点。 -
非减函数的判定边界
MLR分布族仅要求似然比为非减函数,不要求严格增,本题中\(U(x_{(n)})\)的向上跳变、区间内恒值的情况,均满足非减的要求,符合MLR的定义。 -
统计量的充分性
本题中\(T(x)=x_{(n)}\)是参数\(\theta\)的充分统计量,这也是MLR分布族的共性:MLR对应的统计量一定是参数的充分统计量,符合因子分解定理的结论。
四、拓展应用:对应单边检验的UMPT
既然该分布族是MLR分布族,根据单边检验的UMPT定理,对于最常用的检验问题:
其水平为\(\alpha\)的一致最优检验(UMPT)为:
其中临界值\(c\)由\(P_{\theta_0}(x_{(n)}>c) + rP_{\theta_0}(x_{(n)}=c) = \alpha\)确定。
因\(x_{(n)}\)是连续型随机变量,\(P(x_{(n)}=c)=0\),无需随机化,最终拒绝域为\(x_{(n)} > \theta_0 \cdot (1-\alpha)^{1/n}\),这也是均匀分布参数单边检验的最优形式。
五、核心知识点汇总表
| 项目 | 核心内容 | 关键说明 |
|---|---|---|
| 分布类型 | 区间\((0,\theta)\)上的均匀分布\(R(0,\theta)\) | 支撑集与参数\(\theta\)相关,非单参数指数族 |
| 样本联合密度 | \(f(x,\theta) = \frac{1}{\theta^n} I\{x_{(1)}\geq0\} I\{x_{(n)}\leq\theta\}\) | 核心化简依赖顺序统计量的等价关系 |
| MLR对应的统计量 | \(T(x) = x_{(n)}\)(样本最大值) | 是参数\(\theta\)的充分统计量 |
| 似然比形式 | \(\lambda(x) = \left( \frac{\theta_0}{\theta_1} \right)^n \cdot \frac{I\{x_{(n)}\leq\theta_1\}}{I\{x_{(n)}\leq\theta_0\}}\) | 分段非减,随\(x_{(n)}\)增大而非减 |
| 核心结论 | 该分布族关于\(x_{(n)}\)为MLR分布族 | 是MLR分布族的经典非指数族案例 |
| 对应检验的UMPT | 拒绝域为\(x_{(n)} > c\),\(c=\theta_0 \cdot (1-\alpha)^{1/n}\) | 单边检验的一致最优检验,由MLR性质保证 |
MLR分布族单边检验的MPT与UMPT 完整讲解与严谨推导
作为数理统计领域深耕60余年的研究员,我将从前置核心定义→引理的严谨证明→NP引理与MLR的本质联系→三类检验的最优性证明→核心知识点归纳全链条,为你完整拆解这个假设检验的核心理论体系,所有推导均做到步骤无跳跃、逻辑可追溯。
一、前置核心定义回顾(所有推导的基础)
在正式讲解前,我们先明确4个贯穿始终的核心概念,确保推导逻辑的一致性:
- MLR分布族:单参数分布族\(\{f(x,\theta),\theta\in\Theta\}\),若对任意\(\theta_1>\theta_0\),似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}=h(T(x))\)是统计量\(T(x)\)的非减函数,则称其为关于\(T(x)\)的单调似然比分布族。
- 检验函数\(\phi(x)\):随机化检验的通用形式,取值规则为:
- \(\phi(x)=1\):拒绝原假设\(H_0\);
- \(\phi(x)=0\):不拒绝原假设\(H_0\);
- \(\phi(x)=\gamma\in(0,1)\):当\(T(x)=k\)时,以概率\(\gamma\)随机拒绝\(H_0\)(用于离散分布补足显著性水平)。
- 检验的水平与势:
- 水平\(\alpha\):原假设成立时,第一类错误概率的上界,即\(E_{\theta\in H_0}[\phi(X)] \leq \alpha\);
- 势函数\(\beta(\theta)=E_\theta[\phi(X)]\):备择假设下,检验拒绝\(H_0\)的概率,势越大,检验的区分能力越强。
- MPT与UMPT:
- MPT(最优势检验):针对简单原假设↔简单备择假设,在所有水平为\(\alpha\)的检验中,备择假设下势最大的检验;
- UMPT(一致最优检验):针对复合备择假设,在所有水平为\(\alpha\)的检验中,对备择假设空间内的每一个\(\theta\),都能达到最大势的检验(即对所有备择参数都是MPT)。
- Neyman-Pearson(NP)基本引理:简单vs简单检验问题中,水平为\(\alpha\)的检验\(\phi(x)\)是MPT的充要条件为:存在常数\(c\geq0\),使得\[\phi(x)= \begin{cases} 1, & \lambda(x) > c \\ \gamma, & \lambda(x) = c \\ 0, & \lambda(x) < c \end{cases}\]且满足\(E_{\theta_0}[\phi(X)]=\alpha\)。
二、引理6.3.1的完整讲解与严谨证明
引理内容
对于MLR分布族,定义检验函数:
则对任意给定的\(0<\alpha<1\),必存在常数\(k\)和\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\)。
完整证明
该引理的核心是:无论统计量\(T(X)\)是连续型还是离散型,都能找到对应的\(k\)和\(\gamma\),使检验的第一类错误概率精确等于显著性水平\(\alpha\)。
步骤1:定义\(T(X)\)在原假设下的分布函数
记原假设\(H_0:\theta=\theta_0\)下,统计量\(T(X)\)的累积分布函数(CDF)为:
根据分布函数的通用性质,\(F_0(t)\)满足:非减、右连续,且\(F_0(-\infty)=0\),\(F_0(+\infty)=1\)。
步骤2:将检验的期望转化为分布函数的形式
检验函数的期望(即原假设下的拒绝概率)为:
利用分布函数的性质,对两项分别变形:
- \(P_{\theta_0}(T(X) > k) = 1 - P_{\theta_0}(T(X) \leq k) = 1 - F_0(k)\)
- \(P_{\theta_0}(T(X) = k) = F_0(k) - F_0(k^-)\),其中\(F_0(k^-)=\lim_{t\to k^-}F_0(t)\)是\(F_0(t)\)在\(k\)点的左极限(跳跃高度)。
因此,期望可改写为:
步骤3:分情况证明\(k\)和\(\gamma\)的存在性
我们分两种通用情况,证明总能找到满足条件的\(k\)和\(\gamma\):
情况1:连续型统计量(无跳跃点)
若\(T(X)\)是连续型随机变量,则\(F_0(t)\)是连续函数,\(P_{\theta_0}(T(X)=k)=0\)(即\(F_0(k)-F_0(k^-)=0\))。
此时式(1)简化为:
由于\(F_0(t)\)连续且严格非减,必然存在唯一的\(k=F_0^{-1}(1-\alpha)\),取\(\gamma=0\)即可满足\(E_{\theta_0}[\phi^*(X)]=\alpha\)。
情况2:离散型统计量(存在跳跃点)
若\(T(X)\)是离散型随机变量,\(F_0(t)\)存在跳跃点,可能不存在\(k\)使得\(F_0(k)=1-\alpha\)。此时必然存在唯一的\(k\),使得:
将该不等式变形,可得:
我们从式(1)中解出\(\gamma\):
结合上述不等式,可证明\(\gamma\in[0,1]\):
- 分子:\(\alpha - (1-F_0(k)) \geq (1-F_0(k)) - (1-F_0(k)) = 0\)
- 分母:\(F_0(k)-F_0(k^-)>0\),且\(\alpha \leq 1-F_0(k^-)\),因此分子\(\leq F_0(k)-F_0(k^-)\),即\(\gamma\leq1\)。
因此,离散型场景下,也必然存在满足条件的\(k\)和\(\gamma\)。
最终结论
无论\(T(X)\)是连续型还是离散型,都存在\(k\)和\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\),引理得证。
三、MLR分布族与NP引理的本质联系
引理给出的\(\phi^*(x)\)是基于统计量\(T(x)\)的阈值检验,而NP引理的最优检验是基于似然比\(\lambda(x)\)的阈值检验,二者的核心联系由MLR的单调性保证,下面我们严谨证明用户给出的两个核心包含关系。
核心前提
MLR分布族的似然比\(\lambda(x)=h(T(x))\)是\(T(x)\)的非减函数,记\(c=h(k)\),我们需要证明:
- \(\{T(x) > k\} \supset \{ \lambda(x) > c \}\)(即\(\lambda(x)>c \implies T(x)>k\))
- \(\{T(x) < k\} \supset \{ \lambda(x) < c \}\)(即\(\lambda(x)<c \implies T(x)<k\))
包含关系的严谨证明
1. 证明\(\{ \lambda(x) > c \} \subset \{ T(x) > k \}\)
反证法:假设存在样本\(x\),使得\(\lambda(x)>c\)但\(T(x)\leq k\)。
由于\(h(T(x))\)是\(T(x)\)的非减函数,若\(T(x)\leq k\),则必有\(h(T(x))\leq h(k)\),即\(\lambda(x)\leq c\),与\(\lambda(x)>c\)的前提矛盾。
因此假设不成立,\(\lambda(x)>c\)必然推出\(T(x)>k\),包含关系得证。
2. 证明\(\{ \lambda(x) < c \} \subset \{ T(x) < k \}\)
反证法:假设存在样本\(x\),使得\(\lambda(x)<c\)但\(T(x)\geq k\)。
由于\(h(T(x))\)是\(T(x)\)的非减函数,若\(T(x)\geq k\),则必有\(h(T(x))\geq h(k)\),即\(\lambda(x)\geq c\),与\(\lambda(x)<c\)的前提矛盾。
因此假设不成立,\(\lambda(x)<c\)必然推出\(T(x)<k\),包含关系得证。
核心推论
- 若\(h(T(x))\)是\(T(x)\)的严格增函数(MLR的特殊情况),则上述包含关系退化为等式:\(\{T(x)>k\}=\{\lambda(x)>c\}\),\(\{T(x)<k\}=\{\lambda(x)<c\}\),此时\(\phi^*(x)\)与NP引理的最优检验形式完全一致。
- 若\(h(T(x))\)是非减非严格增函数(MLR的一般情况),则\(\phi^*(x)\)与NP引理的最优检验,在\(\lambda(x)\neq c\)的区域取值完全一致,仅在\(\lambda(x)=c\)的边界区域可能存在差异,而这一差异不影响检验的最优性。
四、三类单边检验问题的最优性证明
我们依次证明\(\phi^*(x)\)是检验问题(i)的MPT、检验问题(ii)和(iii)的UMPT,三类检验问题的定义为:
- (i) \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta=\theta_1 \ (\theta_1>\theta_0)\)(简单vs简单)
- (ii) \(H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(简单vs复合单边)
- (iii) \(H_0:\theta\leq\theta_0 \longleftrightarrow H_1:\theta>\theta_0\)(复合vs复合单边,最常用)
1. 证明\(\phi^*(x)\)是检验问题(i)的MPT
证明思路
根据NP引理,只要证明\(\phi^*(x)\)与NP引理给出的MPT具有完全相同的势,即可证明\(\phi^*(x)\)也是MPT。
完整证明
-
记NP引理给出的水平\(\alpha\)的MPT为\(\phi(x)\),其形式为:
\[\phi(x)= \begin{cases} 1, & \lambda(x) > c \\ \gamma', & \lambda(x) = c \\ 0, & \lambda(x) < c \end{cases}\]满足\(E_{\theta_0}[\phi(X)]=\alpha\)。
-
对比\(\phi^*(x)\)与\(\phi(x)\)的取值:
- 在\(\lambda(x)>c\)区域:该区域属于\(\{T(x)>k\}\),因此\(\phi^*(x)=1\),与\(\phi(x)\)取值完全一致;
- 在\(\lambda(x)<c\)区域:该区域属于\(\{T(x)<k\}\),因此\(\phi^*(x)=0\),与\(\phi(x)\)取值完全一致;
- 仅在\(\lambda(x)=c\)的边界区域,二者的随机化因子可能不同。
-
证明二者的势完全相等:
检验的势为\(E_{\theta_1}[\phi(X)]\),将期望拆分为三个区域的积分:\[E_{\theta}[\phi(X)] = \int_{\lambda>c} \phi f(x,\theta)dx + \int_{\lambda=c} \phi f(x,\theta)dx + \int_{\lambda<c} \phi f(x,\theta)dx \]由于\(\lambda>c\)和\(\lambda<c\)区域内\(\phi^*\)与\(\phi\)取值一致,因此这两部分的积分完全相等,差异仅存在于\(\lambda=c\)的边界区域。
在\(\lambda=c\)区域,似然比\(\lambda(x)=\frac{f(x,\theta_1)}{f(x,\theta_0)}=c\),因此\(f(x,\theta_1)=c\cdot f(x,\theta_0)\)。计算二者的势差:
\[\Delta E_{\theta_1} = \int_{\lambda=c} [\phi^*(x)-\phi(x)] f(x,\theta_1)dx = c \cdot \int_{\lambda=c} [\phi^*(x)-\phi(x)] f(x,\theta_0)dx = c\cdot \Delta E_{\theta_0} \]而\(\Delta E_{\theta_0}=E_{\theta_0}[\phi^*(X)] - E_{\theta_0}[\phi(X)] = \alpha-\alpha=0\),因此\(\Delta E_{\theta_1}=0\),即\(E_{\theta_1}[\phi^*(X)]=E_{\theta_1}[\phi(X)]\)。
-
最终结论:\(\phi^*(x)\)与NP引理的MPT具有完全相同的势,因此\(\phi^*(x)\)也是检验问题(i)的MPT。
2. 证明\(\phi^*(x)\)是检验问题(ii)的UMPT
证明思路
UMPT的核心要求是:对备择假设中任意的\(\theta_1>\theta_0\),\(\phi^*(x)\)都是对应的简单vs简单检验的MPT。
完整证明
- 对任意固定的\(\theta_1>\theta_0\),根据上述证明,\(\phi^*(x)\)是\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)的水平\(\alpha\)的MPT。
- 关键性质:\(\phi^*(x)\)的形式仅由\(\theta_0\)和\(\alpha\)确定,与具体的\(\theta_1\)无关。也就是说,无论备择参数\(\theta_1\)取何值(只要\(\theta_1>\theta_0\)),\(\phi^*(x)\)都是对应的MPT。
- 根据UMPT的定义,\(\phi^*(x)\)对备择假设空间内的所有\(\theta\)都达到最大势,因此\(\phi^*(x)\)是检验问题(ii)的水平\(\alpha\)的UMPT。
3. 证明\(\phi^*(x)\)是检验问题(iii)的UMPT
这是实际应用最广泛的检验问题,证明分为两步:先证明\(\phi^*(x)\)满足水平要求,再证明其一致最优性。
前置引理:势函数的单调性
\(\phi^*(x)\)的势函数\(\beta(\theta)=E_\theta[\phi^*(X)]\)是\(\theta\)的非减函数。
证明:对任意\(\theta_2>\theta_1\),似然比\(\lambda(x)=\frac{f(x,\theta_2)}{f(x,\theta_1)}\)是\(T(x)\)的非减函数,\(\phi^*(x)\)也是\(T(x)\)的非减函数。根据切比雪夫关联不等式:两个非减函数的协方差非负,即
而\(E[\lambda(X)] = \int \frac{f(x,\theta_2)}{f(x,\theta_1)} \cdot f(x,\theta_1)dx = 1\),因此:
势函数的非减性得证。
步骤1:证明\(\phi^*(x)\)是水平\(\alpha\)的检验
复合原假设的水平要求是:对所有\(\theta\leq\theta_0\),都有\(E_\theta[\phi^*(X)] \leq \alpha\)。
根据势函数的非减性,对任意\(\theta\leq\theta_0\),有:
完全满足水平\(\alpha\)的要求。
步骤2:证明\(\phi^*(x)\)是UMPT
任取一个水平为\(\alpha\)的检验\(\phi'(x)\),即对所有\(\theta\leq\theta_0\),有\(E_\theta[\phi'(X)] \leq \alpha\)。
对任意\(\theta_1>\theta_0\),\(\phi'(x)\)是\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\)的一个水平\(\leq\alpha\)的检验,而\(\phi^*(x)\)是该检验的水平\(\alpha\)的MPT,因此必有:
由于\(\theta_1>\theta_0\)是任意的,因此\(\phi^*(x)\)对备择假设中所有的\(\theta\)都具有最大势,即\(\phi^*(x)\)是检验问题(iii)的水平\(\alpha\)的UMPT。
五、核心知识点归纳总结表
| 分类 | 核心内容 | 关键结论 | 核心理论依据 |
|---|---|---|---|
| 引理6.3.1 | 检验函数\(\phi^*(x)=\begin{cases}1, & T(x)>k \\ \gamma, & T(x)=k \\ 0, & T(x)<k\end{cases}\) | 对任意\(0<\alpha<1\),必存在\(k\)和\(\gamma\in[0,1]\),使得\(E_{\theta_0}[\phi^*(X)]=\alpha\) | 统计量分布函数的非减、右连续性质,随机化检验补足显著性水平 |
| MLR与NP引理的联系 | 似然比\(\lambda(x)=h(T(x))\)是\(T(x)\)的非减函数 | 1. \(\{\lambda(x)>c\} \subset \{T(x)>k\}\) 2. \(\{\lambda(x)<c\} \subset \{T(x)<k\}\) 3. 严格增时取等号 |
非减函数的单调性性质,反证法 |
| 检验问题(i):\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta=\theta_1\) | 简单vs简单单边检验 | \(\phi^*(x)\)是该问题水平\(\alpha\)的MPT | NP基本引理,似然比边界区域的势相等性 |
| 检验问题(ii):\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\) | 简单vs复合单边检验 | \(\phi^*(x)\)是该问题水平\(\alpha\)的UMPT | \(\phi^*(x)\)的形式与备择参数\(\theta_1\)无关,对所有\(\theta>\theta_0\)都是MPT |
| 检验问题(iii):\(H_0:\theta\leq\theta_0 \leftrightarrow H_1:\theta>\theta_0\) | 复合vs复合单边检验 | \(\phi^*(x)\)是该问题水平\(\alpha\)的UMPT | 势函数的非减性(保证水平要求),对所有备择参数的MPT性质 |
| 势函数核心性质 | \(\beta(\theta)=E_\theta[\phi^*(X)]\) | 是参数\(\theta\)的非减函数 | 切比雪夫关联不等式,MLR的单调性 |
| 通用适用范围 | 所有MLR分布族 | 单边检验的UMPT一定存在,且形式为基于\(T(x)\)的阈值检验 | MLR分布族的似然比单调性,NP引理的推广 |
理论闭环总结
NP引理解决了简单vs简单检验的最优性,而MLR分布族的核心价值,是将NP引理的最优性从单个备择参数推广到整个单边备择参数空间,最终得到了实际应用中最常用的复合单边检验的一致最优检验(UMPT)。这一理论体系是现代参数假设检验的核心基石,我们日常使用的Z检验、t检验、卡方检验、泊松检验的单边形式,其最优性均由该理论保证。
定理6.3.1与推论 完整讲解与严谨推导
一、定理6.3.1 核心内容与思想
定理陈述
设 ( X \sim {f(x,\theta), \theta \in \mathbb{R}} ) 为关于 ( T = T(x) ) 的MLR分布族,则由(6.3.1)定义的检验函数
[
\phi^*(x) =
\begin{cases}
1, & T(x) > k, \
\gamma, & T(x) = k, \
0, & T(x) < k,
\end{cases}
]
是假设检验问题
- (i) ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 \ (\theta_1 > \theta_0) ) 的最优势检验(MPT);
- (ii) ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta > \theta_0 ) 的一致最优检验(UMPT)。
核心思想
MLR分布族的似然比 ( \lambda(x) = \frac{f(x,\theta_1)}{f(x,\theta_0)} = h(T(x)) ) 是 ( T(x) ) 的非减函数,这使得似然比阈值检验等价于统计量阈值检验,从而将Neyman-Pearson(NP)引理的最优性从“单个备择参数”推广到“整个单边备择参数空间”,最终得到复合单边检验的一致最优解。
二、定理6.3.1 详细证明过程
步骤1:集合分解(利用MLR单调性)
取 ( c = h(k) ),由于 ( h(t) ) 是非减函数,因此:
- 当 ( T(x) > k ) 时,必有 ( h(T(x)) \geq h(k) = c ),即 ( \lambda(x) \geq c ),因此
[
{x: T(x) > k} = {x: T(x) > k, \lambda(x) > c} \cup {x: T(x) > k, \lambda(x) = c}.
] - 当 ( T(x) < k ) 时,必有 ( h(T(x)) \leq h(k) = c ),即 ( \lambda(x) \leq c ),因此
[
{x: T(x) < k} = {x: T(x) < k, \lambda(x) < c} \cup {x: T(x) < k, \lambda(x) = c}.
]
步骤2:重写 ( \phi^*(x) ) 为NP引理相容形式
根据集合分解,( \phi^(x) ) 可按似然比 ( \lambda(x) ) 重新表示为:
[
\phi^(x) =
\begin{cases}
1, & \lambda(x) > c, \
\gamma^(x), & \lambda(x) = c, \
0, & \lambda(x) < c,
\end{cases}
]
其中分段函数 ( \gamma^(x) ) 定义为:
[
\gamma^*(x) =
\begin{cases}
1, & T(x) > k, \lambda(x) = c, \
\gamma, & T(x) = k, \lambda(x) = c, \
0, & T(x) < k, \lambda(x) = c.
\end{cases}
]
这一形式与NP引理的最优势检验(MPT)结构完全一致:
- ( \lambda(x) > c ):必然拒绝 ( H_0 )(( \phi^*(x)=1 ));
- ( \lambda(x) < c ):必然不拒绝 ( H_0 )(( \phi^*(x)=0 ));
- ( \lambda(x) = c ):根据 ( T(x) ) 的取值进行随机化决策。
步骤3:验证MPT性质
由引理6.3.1,( E_{\theta_0}[\phi^*(X)] = \alpha ),满足检验的水平要求。结合NP引理的唯一性条件:
- 若一个检验满足NP引理的结构且达到水平 ( \alpha ),则它是该水平下的唯一MPT。
因此 ( \phi^*(x) ) 是检验问题(i)的MPT。
步骤4:推广到UMPT
( \phi^*(x) ) 的形式仅由 ( \theta_0 ) 和 ( \alpha ) 确定,与备择参数 ( \theta_1 ) 无关。这意味着:
- 对任意 ( \theta_1 > \theta_0 ),( \phi^*(x) ) 都是 ( H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta = \theta_1 ) 的MPT;
- 因此,对整个备择空间 ( \theta > \theta_0 ),( \phi^*(x) ) 都保持最优性,即它是检验问题(ii)的UMPT。
三、推论 内容与直观理解
推论陈述
任给 ( \alpha' ),设 ( E_{\theta'}[\phi^(X)] = \alpha' ),则 ( \phi^(x) ) 为以下检验 (i)'、(ii)' 水平为 ( \alpha' ) 的UMPT:
- (i)' ( H_0: \theta = \theta' \longleftrightarrow H_1: \theta = \theta_1 ),但 ( \theta_1 > \theta' );
- (ii)' ( H_0: \theta = \theta' \longleftrightarrow H_1: \theta > \theta' )。
核心解读
- 本质是参数平移:推论只是将原假设参数从 ( \theta_0 ) 替换为 ( \theta' ),证明逻辑与定理6.3.1完全一致——MLR分布族的单调性对任意 ( \theta' ) 都成立,因此 ( \phi^*(x) ) 的最优性可直接推广。
- 数学便利性:从观念上看,水平 ( \alpha ) 常与第一类错误联系,但数学上只需满足 ( 0 < \alpha < 1 ),无需固定 ( \alpha )。这使得我们可根据需要灵活选择 ( \alpha' )(如 ( \alpha' = 1-\alpha )),极大简化了后续推导。
四、核心知识点归纳总结表
| 模块 | 核心内容 | 关键结论 | 理论依据 |
|---|---|---|---|
| 定理6.3.1 | MLR分布族下,统计量阈值检验 ( \phi^*(x) ) 的最优性 | ( \phi^*(x) ) 是(i)的MPT,(ii)的UMPT | MLR单调性 + NP引理 + 唯一性 |
| 集合分解 | 基于 ( h(t) ) 非减性拆分 ( {T(x) > k} ) 和 ( {T(x) < k} ) | ( {T(x) > k} = {T(x) > k, \lambda > c} \cup {T(x) > k, \lambda = c} ) | 非减函数的保序性 |
| NP引理相容化 | 重写 ( \phi^*(x) ) 为似然比阈值形式 | ( \phi^*(x) ) 满足NP引理的MPT结构 | 似然比与统计量的等价性 |
| UMPT推广 | ( \phi^*(x) ) 与备择参数 ( \theta_1 ) 无关 | 对所有 ( \theta > \theta_0 ),( \phi^*(x) ) 都是MPT | 最优性的一致性 |
| 推论 | 原假设参数平移后的最优性 | ( \phi^*(x) ) 是(i)'、(ii)' 的UMPT | MLR性质的普适性 + 定理6.3.1的平移不变性 |
| 应用价值 | 为单边检验提供统一最优框架 | 日常使用的Z检验、t检验等单边形式的最优性均由此保证 | 从理论上支撑了经典检验方法的合理性 |
posted on 2026-03-03 08:08 Indian_Mysore 阅读(0) 评论(0) 收藏 举报
浙公网安备 33010602011771号