昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

7.2.2一致最准确置信域(UMA)

一致最准确置信域(UMA) 知识点深度讲解与完整推导证明

本章节的核心逻辑是:置信域的优良性与假设检验的优良性通过对偶关系一一对应——最优的假设检验(UMP/UMPU),必然对应最优的置信域(UMA/UMAU),我们将从定义、对偶定理、优良性证明、单侧拓展四个维度,完成完整的讲解与推导。


一、前置核心回顾:置信域与假设检验的对偶关系

整个UMA理论的根基是二者的对偶性,先凝练核心等价关系,为后续推导铺垫:

  1. 事件等价\(X \in A(\theta) \iff \theta \in S(X)\),其中\(A(\theta)\)是假设\(H_0:\theta=\theta_0\)的接受域,\(S(X)\)是参数\(\theta\)的置信域。
  2. 概率等价\(P_\theta\{X \in A(\theta)\} = P_\theta\{\theta \in S(X)\} \geq 1-\alpha\),前者是检验的接受概率,后者是置信域的覆盖概率。
  3. 功效函数对应:检验的功效函数\(\beta_\phi(\theta) = E_\theta[\phi(X)] = P_\theta\{X \in \overline{A(\theta)}\} = 1 - P_\theta\{X \in A(\theta)\}\),即备择假设下拒绝原假设的概率,是检验优良性的核心指标。

二、核心定义的深度讲解

1. 一致最准确置信域(UMA)

定义7.2.1

参数\(\theta\)的水平为\(1-\alpha\)的置信域\(S(x)\)称为一致最准确置信域(UMA),若对任一水平为\(1-\alpha\)的置信域\(S^*(x)\),有:

\[P_\theta\{\theta' \in S(X)\} \leq P_\theta\{\theta' \in S^*(X)\}, \quad \forall \theta' \neq \theta \]

定义内涵拆解

  • 符号含义:\(\theta\)真实参数\(\theta'\)非真实参数(错误参数值)
  • 核心本质:在所有满足“覆盖真实参数概率≥1-α”的置信域中,UMA置信域包含错误参数的概率一致最小
  • 命名逻辑:
    • 「准确」:置信域的核心目标是“只包含真实参数,不包含错误参数”,包含错误参数的概率越小,置信域的精准度越高;
    • 「一致」:这个“最小性”对所有非真实参数\(\theta' \neq \theta\)都成立,而非仅对特定的\(\theta'\)成立。

2. 无偏置信域与一致最准确无偏置信域(UMAU)

定义7.2.2

\(S(X)\)\(\theta\)的水平为\(1-\alpha\)无偏置信域,若满足:

\[P_\theta\{\theta \in S(X)\} \geq 1-\alpha, \quad P_\theta\{\theta' \in S(X)\} \leq 1-\alpha, \quad \forall \theta' \neq \theta \]

若对所有无偏置信域,都满足UMA的核心不等式,则称\(S(x)\)一致最准确无偏置信域(UMAU)

定义内涵拆解

  • 无偏性的意义:置信域包含真实参数的概率≥1-α,包含任何错误参数的概率≤1-α,避免出现“包含错误参数的概率比真实参数还高”的有偏情况。
  • 存在价值:双侧检验场景下通常不存在UMP检验,但存在一致最优无偏检验(UMPU),对应的UMAU置信域解决了UMA不存在的场景,是UMA的核心拓展。

三、核心对偶定理:UMA与UMP检验的充要条件

定理7.2.1 核心结论

水平为\(1-\alpha\)的置信域\(S(x)\)是UMA置信域的充要条件是:其对应的检验函数\(\phi(x,\theta_0)\)是假设检验问题

\[H_0:\theta=\theta_0 \longleftrightarrow H_1:\theta \in \Theta_1 \ (\theta_0 \notin \Theta_1) \]

的水平为\(\alpha\)的一致最优检验(UMP检验),且该结论对所有\(\theta_0 \in \Theta\)成立。


(1)必要性证明:UMA置信域 → 对应检验是UMP检验

证明目标

\(S(x)\)是UMA置信域,对任意其他水平为1-α的置信域\(S^*(x)\)对应的检验函数\(\phi^*(x,\theta_0)\),有:

\[\beta_\phi(\theta) \geq \beta_{\phi^*}(\theta), \quad \forall \theta \neq \theta_0 \]

即对应检验在备择假设下的功效一致最大,符合UMP检验的定义。

分步严格推导

  1. 从UMA定义出发,写出核心不等式
    由UMA的定义,对任意同水平的置信域\(S^*(x)\),所有非真实参数\(\theta' \neq \theta\)满足:

    \[P_\theta\{\theta' \in S(X)\} \leq P_\theta\{\theta' \in S^*(X)\} \]

  2. 对偶关系转化:置信域事件 → 接受域事件
    由事件等价性\(\theta' \in S(X) \iff X \in A(\theta')\),概率完全等价,因此不等式转化为:

    \[P_\theta\{X \in A(\theta')\} \leq P_\theta\{X \in A^*(\theta')\}, \quad \forall \theta' \neq \theta \]

  3. 接受域概率 → 功效函数转化
    接受域与拒绝域为补集,结合功效函数的定义\(\beta_\phi(\theta) = P_\theta\{X \in \overline{A(\theta')}\}\),可得:

    \[P_\theta\{X \in A(\theta')\} = 1 - \beta_\phi(\theta), \quad P_\theta\{X \in A^*(\theta')\} = 1 - \beta_{\phi^*}(\theta) \]

  4. 不等式变形,得到功效比较结果
    将上式代入核心不等式:

    \[1 - \beta_\phi(\theta) \leq 1 - \beta_{\phi^*}(\theta) \]

    两边同乘-1,不等号反转,得到:

    \[\beta_\phi(\theta) \geq \beta_{\phi^*}(\theta), \quad \forall \theta' \neq \theta \]

  5. 完成必要性证明
    \(\theta' = \theta_0\)(原假设参数),则\(\theta\)为备择假设参数(\(\theta \neq \theta_0\)),不等式变为:

    \[\beta_\phi(\theta) \geq \beta_{\phi^*}(\theta), \quad \forall \theta \neq \theta_0 \]

    完全符合UMP检验的定义,必要性得证。


(2)充分性证明:UMP检验 → 对应置信域是UMA

证明目标

\(\phi(x,\theta_0)\)是上述检验问题的水平为α的UMP检验,其对应的置信域\(S(x)\),对任意同水平的置信域\(S^*(x)\),满足UMA的核心不等式:

\[P_\theta\{\theta' \in S(X)\} \leq P_\theta\{\theta' \in S^*(X)\}, \quad \forall \theta' \neq \theta \]

分步严格推导

  1. 从UMP检验定义出发,写出核心不等式
    由UMP检验的定义,对任意同水平的检验函数\(\phi^*(x,\theta_0)\),所有备择假设参数\(\theta \neq \theta_0\)满足:

    \[\beta_\phi(\theta) \geq \beta_{\phi^*}(\theta) \]

  2. 功效函数 → 接受域概率转化
    同必要性的推导,功效函数与接受域概率满足:

    \[\beta_\phi(\theta) = 1 - P_\theta\{X \in A(\theta_0)\}, \quad \beta_{\phi^*}(\theta) = 1 - P_\theta\{X \in A^*(\theta_0)\} \]

  3. 不等式变形,得到接受域概率比较结果
    代入UMP的核心不等式:

    \[1 - P_\theta\{X \in A(\theta_0)\} \geq 1 - P_\theta\{X \in A^*(\theta_0)\} \]

    不等号反转后得到:

    \[P_\theta\{X \in A(\theta_0)\} \leq P_\theta\{X \in A^*(\theta_0)\}, \quad \forall \theta \neq \theta_0 \]

  4. 对偶关系转化:接受域事件 → 置信域事件
    由事件等价性\(X \in A(\theta_0) \iff \theta_0 \in S(X)\),概率完全等价,因此:

    \[P_\theta\{\theta_0 \in S(X)\} \leq P_\theta\{\theta_0 \in S^*(X)\}, \quad \forall \theta \neq \theta_0 \]

  5. 完成充分性证明
    \(\theta_0 = \theta'\)(非真实参数),则\(\theta\)为真实参数,\(\theta' \neq \theta\),不等式变为:

    \[P_\theta\{\theta' \in S(X)\} \leq P_\theta\{\theta' \in S^*(X)\}, \quad \forall \theta' \neq \theta \]

    完全符合UMA置信域的定义,充分性得证。


核心推论

水平为\(1-\alpha\)的置信域\(S(x)\)是UMAU置信域的充要条件是:其对应的检验函数是上述假设检验问题的水平为α的一致最优无偏检验(UMPU检验)

逻辑与主定理完全一致:无偏置信域的条件\(P_\theta\{\theta' \in S(X)\} \leq 1-\alpha\),等价于无偏检验的条件\(\beta_\phi(\theta') \geq \alpha\),二者一一对应。


四、UMA置信域的优良性定理:平均测度最小

定理7.2.2 核心结论

\(X \sim P_\theta(x)\)\(S(x) \subset \Theta\)\(\theta\)的水平为\(1-\alpha\)的UMA置信域。设\(m\)为参数空间\(\Theta\)上的测度,满足单点集测度\(m\{\theta\}=0\),且\(S(x)\)\(S^*(x)\)关于\(m\)可测有界,则必有:

\[E_\theta\{m[S(X)]\} \leq E_\theta\{m[S^*(X)]\}, \quad \forall \theta \in \Theta \]

其中\(S^*(x)\)是任意水平为\(1-\alpha\)的置信域。

定理内涵

  • \(m[S(X)]\):置信域的测度,一维参数下为置信区间的长度,二维下为面积,高维下为体积;
  • \(E_\theta\{m[S(X)]\}\):置信域的平均测度(平均长度/体积)
  • 核心价值:将抽象的“包含错误参数概率最小”,转化为直观的“平均长度最短”,是UMA置信域最具实际应用价值的性质。

分步严格证明

  1. 期望的积分展开与示性函数表示
    由期望的定义,置信域测度的期望可写为样本空间上的积分:

    \[E_\theta\{m[S(X)]\} = \int_{\mathcal{X}} m[S(x)] dP_\theta(x) \]

    而集合的测度可表示为参数空间上示性函数的积分(示性函数\(I\{\cdot\}\)在事件成立时取1,否则取0):

    \[m[S(x)] = \int_{\Theta} I\{\theta': \theta' \in S(x)\} dm(\theta') \]

    代入期望表达式,得到二重积分:

    \[E_\theta\{m[S(X)]\} = \int_{\mathcal{X}} \left( \int_{\Theta} I\{\theta': \theta' \in S(x)\} dm(\theta') \right) dP_\theta(x) \]

  2. Fubini定理交换积分次序
    示性函数有界,积分区域满足σ-有限条件,因此可交换二重积分的次序,先对样本空间积分,再对参数空间积分:

    \[E_\theta\{m[S(X)]\} = \int_{\Theta} \left( \int_{\mathcal{X}} I\{\theta': \theta' \in S(x)\} dP_\theta(x) \right) dm(\theta') \]

  3. 示性函数积分转化为概率
    示性函数的积分(期望)等于对应事件的发生概率,因此:

    \[\int_{\mathcal{X}} I\{\theta': \theta' \in S(x)\} dP_\theta(x) = P_\theta\{\theta' \in S(X)\} \]

    最终得到核心化简结果:

    \[E_\theta\{m[S(X)]\} = \int_{\Theta} P_\theta\{\theta' \in S(X)\} dm(\theta') \]

    同理,对任意其他置信域\(S^*(x)\),有:

    \[E_\theta\{m[S^*(X)]\} = \int_{\Theta} P_\theta\{\theta' \in S^*(X)\} dm(\theta') \]

  4. 利用UMA定义比较积分大小
    由于单点集测度\(m\{\theta\}=0\),去掉真实参数\(\theta\)不改变积分值:

    \[\int_{\Theta} P_\theta\{\theta' \in S(X)\} dm(\theta') = \int_{\Theta - \{\theta\}} P_\theta\{\theta' \in S(X)\} dm(\theta') \]

    由UMA的定义,对所有\(\theta' \neq \theta\),有\(P_\theta\{\theta' \in S(X)\} \leq P_\theta\{\theta' \in S^*(X)\}\),因此被积函数在整个积分区域上满足左≤右,积分后仍满足:

    \[\int_{\Theta - \{\theta\}} P_\theta\{\theta' \in S(X)\} dm(\theta') \leq \int_{\Theta - \{\theta\}} P_\theta\{\theta' \in S^*(X)\} dm(\theta') \]

  5. 完成证明
    将积分还原为期望表达式,最终得到:

    \[E_\theta\{m[S(X)]\} \leq E_\theta\{m[S^*(X)]\}, \quad \forall \theta \in \Theta \]

    定理得证。


两个核心推论

  1. 推论1(一维置信区间)
    \([\underline{\theta}(X), \bar{\theta}(X)]\)是水平为\(1-\alpha\)的UMA置信区间,则对任意同水平的置信区间\([\underline{\theta}^*(X), \bar{\theta}^*(X)]\),有:

    \[E_\theta[\bar{\theta}(X) - \underline{\theta}(X)] \leq E_\theta[\bar{\theta}^*(X) - \underline{\theta}^*(X)] \]

    UMA置信区间的平均长度最短,是定理7.2.2的一维特例(测度为勒贝格测度)。

  2. 推论2(无偏置信域)
    定理7.2.2与推论1的结论,对UMAU置信域完全成立,即UMAU置信域的平均测度是所有无偏置信域中最小的。


五、单侧置信限的UMA性质

1. UMA单侧置信限的定义

UMA置信下限

水平为\(1-\alpha\)的置信下限\(\underline{\theta}(X)\),满足\(P_\theta\{\theta \in [\underline{\theta}(X), +\infty)\} \geq 1-\alpha\),且对任意同水平的置信下限\(\underline{\theta}^*(X)\),有:

\[P_\theta\{\theta' \in [\underline{\theta}(X), +\infty)\} \leq P_\theta\{\theta' \in [\underline{\theta}^*(X), +\infty)\}, \quad \forall \theta' < \theta \]

直观意义:UMA置信下限比其他置信下限更靠近真实参数\(\theta\),不会过度低估真实参数,包含过小错误值的概率最小。

UMA置信上限

水平为\(1-\alpha\)的置信上限\(\bar{\theta}(X)\),满足\(P_\theta\{\theta \in (-\infty, \bar{\theta}(X)]\} \geq 1-\alpha\),且对任意同水平的置信上限\(\bar{\theta}^*(X)\),有:

\[P_\theta\{\theta' \in (-\infty, \bar{\theta}(X)]\} \leq P_\theta\{\theta' \in (-\infty, \bar{\theta}^*(X)]\}, \quad \forall \theta' > \theta \]

直观意义:UMA置信上限比其他置信上限更靠近真实参数\(\theta\),不会过度高估真实参数,包含过大错误值的概率最小。


定理7.2.3 UMA置信下限的期望损失最小

定理核心结论

\(X \sim P_\theta(x)\)为连续型分布,\(\underline{\theta}(X)\)是水平为\(1-\alpha\)的UMA置信下限,\(\underline{\theta}^*(X)\)是任意同水平的置信下限,二者均有连续分布且期望存在。记正部函数\(a^+ = \max(a, 0)\),则必有:

\[E_\theta[\theta - \underline{\theta}(X)]^+ \leq E_\theta[\theta - \underline{\theta}^*(X)]^+, \quad \forall \theta \in \Theta \]

定理内涵

\([\theta - \underline{\theta}(X)]^+\)是置信下限的低估损失:当\(\underline{\theta}(X) < \theta\)时,损失为真实参数与置信下限的差距;当\(\underline{\theta}(X) \geq \theta\)时,损失为0。定理证明了UMA置信下限的平均低估损失是所有同水平置信下限中最小的。


分步严格证明

  1. 定义随机变量与分布函数
    \(U = [\theta - \underline{\theta}(X)]^+\)\(U^* = [\theta - \underline{\theta}^*(X)]^+\),二者的分布函数分别为:

    \[F_\theta(u) = P_\theta(U \leq u), \quad F_\theta^*(u) = P_\theta(U^* \leq u) \]

    由正部函数的定义,当\(u \leq 0\)时,\(U \leq u\)为不可能事件,因此\(F_\theta(u) = 0\)

  2. 推导\(u>0\)时的分布函数表达式
    \(u>0\)时,正部的不等式等价于内部不等式,因此:

    \[F_\theta(u) = P_\theta(\theta - \underline{\theta}(X) \leq u) = P_\theta(\theta - u \leq \underline{\theta}(X)) \]

    变形为补事件的概率:

    \[F_\theta(u) = 1 - P_\theta(\theta - u > \underline{\theta}(X)) \]

  3. 转化为置信下限的覆盖概率
    \(\theta' = \theta - u\),因\(u>0\),故\(\theta' < \theta\)(非真实参数),因此:

    \[P_\theta(\theta - u > \underline{\theta}(X)) = P_\theta(\theta' \in [\underline{\theta}(X), +\infty)) \]

    最终得到生存函数的表达式:

    \[1 - F_\theta(u) = P_\theta(\theta' \in [\underline{\theta}(X), +\infty)) \]

    同理,对\(U^*\)有:

    \[1 - F_\theta^*(u) = P_\theta(\theta' \in [\underline{\theta}^*(X), +\infty)) \]

  4. 利用UMA定义比较生存函数
    由UMA置信下限的定义,对所有\(\theta' < \theta\)(即\(u>0\)),有:

    \[P_\theta(\theta' \in [\underline{\theta}(X), +\infty)) \leq P_\theta(\theta' \in [\underline{\theta}^*(X), +\infty)) \]

    代入生存函数表达式,得到:

    \[1 - F_\theta(u) \leq 1 - F_\theta^*(u), \quad \forall u>0 \]

  5. 非负随机变量期望公式完成证明
    概率论核心结论:非负随机变量的期望等于其生存函数从0到无穷的积分,即:

    \[E_\theta(U) = \int_0^{+\infty} [1 - F_\theta(u)] du, \quad E_\theta(U^*) = \int_0^{+\infty} [1 - F_\theta^*(u)] du \]

    由生存函数的大小关系,积分后满足:

    \[\int_0^{+\infty} [1 - F_\theta(u)] du \leq \int_0^{+\infty} [1 - F_\theta^*(u)] du \]

    即:

    \[E_\theta[\theta - \underline{\theta}(X)]^+ \leq E_\theta[\theta - \underline{\theta}^*(X)]^+ \]

    定理得证。


对应推论(UMA置信上限)

\(\bar{\theta}(X)\)是水平为\(1-\alpha\)的UMA置信上限,\(\bar{\theta}^*(X)\)是任意同水平的置信上限,满足定理条件,则必有:

\[E_\theta[\bar{\theta}(X) - \theta]^+ \leq E_\theta[\bar{\theta}^*(X) - \theta]^+, \quad \forall \theta \in \Theta \]

即UMA置信上限的平均高估损失最小。


六、知识点归纳总结表

分类 核心对象 定义/核心结论 对应假设检验对象 核心优良性
基础定义 一致最准确置信域(UMA) 水平1-α的置信域中,对所有\(\theta' \neq \theta\),包含非真实参数的概率\(P_\theta\{\theta' \in S(X)\}\)一致最小 一致最优检验(UMP检验) 包含错误参数概率最小,平均测度(长度/体积)最小
一致最准确无偏置信域(UMAU) 水平1-α的无偏置信域中,对所有\(\theta' \neq \theta\),包含非真实参数的概率一致最小 一致最优无偏检验(UMPU检验) 无偏性前提下,平均测度最小,解决双侧场景UMA不存在的问题
UMA置信下限 水平1-α的置信下限中,对所有\(\theta' < \theta\),包含非真实参数的概率一致最小 单侧UMP检验(\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\) 平均低估损失最小,更靠近真实参数
UMA置信上限 水平1-α的置信上限中,对所有\(\theta' > \theta\),包含非真实参数的概率一致最小 单侧UMP检验(\(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta<\theta_0\) 平均高估损失最小,更靠近真实参数
核心对偶定理 充要条件 置信域是UMA ↔ 对应检验是UMP检验;置信域是UMAU ↔ 对应检验是UMPU检验 检验与置信域一一映射,事件、概率、优良性完全等价 无需重复推导,可直接由最优检验得到最优置信域
优良性定理 平均测度最小 UMA/UMAU置信域的平均测度(长度/体积),在同水平的同类置信域中一致最小 检验的功效最大,对应置信域的精度最高 直观体现为置信区间的平均长度最短,估计精度最高
实际应用 典型场景 1. 单调似然比分布族的单侧置信限(UMA);2. 正态总体单侧Z/t检验对应的置信限(UMA);3. 正态总体双侧t/卡方/F检验对应的置信区间(UMAU);4. 均匀分布参数的双侧置信区间(UMAU) 直接复用第六章的最优检验结果,通过对偶关系直接得到最优置信域 大幅简化区间估计的推导,保证估计的最优性

例7.2.3 完整讲解与详细推导

本例是置信域与假设检验对偶关系的核心应用案例,完整展示了如何从最优假设检验(UMPT/UMPUT)推导对应的最优置信域(UMA置信下限/UMAU置信区间),我们将补全课本省略的理论依据、推导细节与直观解释。


一、前置基础回顾

1. 分布设定与核心统计量

\(X_1,X_2,\dots,X_n\)独立同分布,\(X_1 \sim \Gamma(1/\theta,1)\),本质是均值为\(\theta\)的指数分布,其概率密度为:

\[f(x,\theta) = \frac{1}{\theta} e^{-x/\theta}, \quad x>0, \theta>0 \]

样本的联合分布为指数族分布:

\[f(x,\theta) = \left( \frac{1}{\theta} \right)^n \exp\left\{ -\frac{1}{\theta} \sum_{i=1}^n x_i \right\} \]

定义充分统计量\(T = T(X) = \sum_{i=1}^n X_i\),由伽马分布的可加性,\(T \sim \Gamma(n, \theta)\),做尺度变换后可得核心分布结论:

\[\frac{2T}{\theta} \sim \chi^2(2n) \]

(卡方分布的自由度为\(2n\),该结论是后续所有推导的核心)

2. 对偶关系核心准则

根据定理7.2.1,最优置信域与最优假设检验一一对应:

  • 单侧UMA置信限 ↔ 单侧假设检验的UMPT(一致最优检验)
  • 双侧UMAU置信区间 ↔ 双侧假设检验的UMPUT(一致最优无偏检验)

二、θ的水平1-α UMA置信下限 完整推导

1. 对应假设检验问题

UMA置信下限对应右侧单侧检验

\[H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta > \theta_0 \]

我们需要先证明该检验存在UMPT,再通过对偶关系反解得到置信下限。

2. UMPT的存在性与拒绝域

样本联合分布为单参数指数族,可写为标准形式:

\[f(x,\theta) = \exp\left\{ -\frac{1}{\theta} T(X) - n\ln\theta \right\} \]

其中自然参数\(Q(\theta) = -1/\theta\)是关于\(\theta\)的严格增函数,因此该分布是关于\(T(X)\)单调似然比分布族

根据Neyman-Pearson引理的推广,单调似然比分布族的单侧检验存在UMPT,拒绝域形式为:

\[R^+ = \{ T > c \} \]

3. 检验临界值与接受域

\(\frac{2T}{\theta_0} \sim \chi^2(2n)\),结合显著性水平\(\alpha\)的要求,拒绝域满足:

\[P_{\theta_0}\left\{ \frac{2T}{\theta_0} > \chi^2(2n, 1-\alpha) \right\} = \alpha \]

其中\(\chi^2(2n, 1-\alpha)\)是自由度为\(2n\)的卡方分布的下侧\(1-\alpha\)分位数。

因此,原假设的接受域为:

\[A(\theta_0) = \left\{ \frac{2T}{\theta_0} \leq \chi^2(2n, 1-\alpha) \right\} \]

满足\(P_{\theta_0}\{X \in A(\theta_0)\} = 1-\alpha\)

4. 对偶反解得到UMA置信下限

对接受域的不等式做等价变形(\(\theta_0>0, T>0\),不等号方向不变):

\[\frac{2T}{\theta_0} \leq \chi^2(2n, 1-\alpha) \iff \theta_0 \geq \frac{2T}{\chi^2(2n, 1-\alpha)} \]

根据置信域的定义,\(\theta\)的水平\(1-\alpha\)的置信下限为:

\[\underline{\theta}(X) = \frac{2T}{\chi^2(2n, 1-\alpha)} \]

对应的单侧置信区间为\(\left[ \frac{2T}{\chi^2(2n, 1-\alpha)}, +\infty \right)\)

5. 最优性说明

由于该检验是水平\(\alpha\)的UMPT(所有同水平检验中功效最大),根据对偶定理,对应的置信下限是水平1-α的UMA置信下限,即所有同水平置信下限中,包含非真实参数\(\theta'<\theta\)的概率一致最小,平均低估损失最小。


三、θ的水平1-α UMAU置信区间 完整推导

1. 对应假设检验问题

UMAU(一致最准确无偏)置信区间对应双侧检验

\[H_0: \theta = \theta_0 \longleftrightarrow H_1: \theta \neq \theta_0 \]

对于指数族的双侧检验,不存在UMPT,但存在UMPUT(一致最优无偏检验),对应的置信域即为UMAU置信区间。

2. UMPUT的存在性与接受域形式

根据单参数指数族双侧无偏检验的核心定理(课本定理6.4.4),该检验的UMPUT拒绝域形式为:

\[R^+ = \{ T < k_1 \text{ 或 } T > k_2 \} \]

对应的接受域为:

\[A(\theta_0) = \{ k_1 < T < k_2 \} \]

3. 接受域的分布变换

利用核心分布结论\(\frac{2T}{\theta_0} \sim \chi^2(2n)\),令\(Y = \frac{2T}{\theta_0}\),则接受域可等价变换为:

\[A(\theta_0) = \left\{ c_1 < \frac{2T}{\theta_0} < c_2 \right\} \]

其中\(c_1 = \frac{2k_1}{\theta_0}\)\(c_2 = \frac{2k_2}{\theta_0}\)\(Y \sim \chi^2(2n)\)

4. 对偶反解得到置信区间形式

对接受域的不等式做双向等价变形:

  1. 左侧不等式:\(c_1 < \frac{2T}{\theta_0} \implies \theta_0 < \frac{2T}{c_1}\)
  2. 右侧不等式:\(\frac{2T}{\theta_0} < c_2 \implies \theta_0 > \frac{2T}{c_2}\)

合并后得到:

\[\frac{2T}{c_2} < \theta_0 < \frac{2T}{c_1} \]

因此置信区间的形式为:

\[C(X) = \left\{ \theta: \frac{2T}{c_2} < \theta < \frac{2T}{c_1} \right\} \]

5. 临界值\(c_1,c_2\)的确定(无偏检验条件)

UMPUT的临界值需满足无偏检验的两个核心条件,我们补全其推导过程:

条件1:水平条件(检验的显著性水平为α)

检验函数\(\phi(X)\)在拒绝域取1,接受域取0,因此水平条件为:

\[E_{\theta_0}[\phi(X)] = P_{\theta_0}(拒绝H_0 | H_0为真) = \alpha \]

对应接受域的概率为:

\[E_{\theta_0}[1-\phi(X)] = P_{\theta_0}(c_1 < Y < c_2) = \int_{c_1}^{c_2} \chi^2(2n,y) dy = 1-\alpha \]

其中\(\chi^2(2n,y)\)是自由度为\(2n\)的卡方分布的概率密度函数。

条件2:无偏性条件(功效函数在θ₀处导数为0)

无偏检验要求备择假设下的功效\(\beta(\theta) \geq \alpha\),即功效函数在\(\theta=\theta_0\)处取得最小值,因此导数\(\beta'(\theta_0)=0\)

对指数族的功效函数求导,最终可推导出无偏性的等价条件:

\[E_{\theta_0}[\phi(X) T(X)] = \alpha E_{\theta_0}[T(X)] \]

变换为接受域的形式(两边乘\(2/\theta_0\),整理后):

\[E_{\theta_0}\left[ (1-\phi(X)) \cdot \frac{2T}{\theta_0} \right] = (1-\alpha) E_{\theta_0}\left[ \frac{2T}{\theta_0} \right] \]

由于\(Y=\frac{2T}{\theta_0} \sim \chi^2(2n)\)\(E[Y]=2n\),因此上式可写为积分形式:

\[\int_{c_1}^{c_2} y \cdot \chi^2(2n,y) dy = 2n(1-\alpha) \]

最终定解方程组

临界值\(c_1,c_2\)需联立求解以下积分方程组:

\[\begin{cases} \displaystyle \int_{c_1}^{c_2} \chi^2(2n,y) dy = 1-\alpha \\ \displaystyle \int_{c_1}^{c_2} y \cdot \chi^2(2n,y) dy = 2n(1-\alpha) \end{cases} \]

解出\(c_1,c_2\)后,代入置信区间形式,即可得到严格的UMAU置信区间

6. 实用近似:等尾置信区间

上述积分方程组无解析解,数值求解较为繁琐,因此实际应用中通常采用等尾置信区间作为近似:

\[\left[ \underline{\theta}(X), \bar{\theta}(X) \right] = \left[ \frac{2T}{\chi^2\left(2n, 1-\frac{\alpha}{2}\right)}, \frac{2T}{\chi^2\left(2n, \frac{\alpha}{2}\right)} \right] \]

近似说明

  1. 构造逻辑:将显著性水平\(\alpha\)平均分配到卡方分布的两侧,即\(P(Y < \chi^2(2n, \alpha/2))=\alpha/2\)\(P(Y > \chi^2(2n, 1-\alpha/2))=\alpha/2\),对应\(c_1=\chi^2(2n, \alpha/2)\)\(c_2=\chi^2(2n, 1-\alpha/2)\)
  2. 最优性:该区间由水平\(1-\alpha/2\)的UMA置信下限和UMA置信上限构成,是无偏置信区间,样本量较大时与严格UMAU置信区间几乎一致,且可直接通过卡方分布表查询分位数,计算便捷。

四、数值示例(直观理解)

设样本量\(n=5\),显著性水平\(\alpha=0.05\),样本和\(T=\sum_{i=1}^5 X_i=20\),则\(2T=40\),自由度\(2n=10\)

  1. 95% UMA置信下限\(\chi^2(10, 0.95)=18.307\),因此\(\underline{\theta}=40/18.307 \approx 2.185\),置信区间为\([2.185, +\infty)\)
  2. 95% 等尾UMAU置信区间\(\chi^2(10, 0.975)=20.483\)\(\chi^2(10, 0.025)=3.247\),因此置信区间为\([40/20.483, 40/3.247] \approx [1.953, 12.319]\)

五、核心结论归纳表

置信域类型 对应假设检验 最优检验类型 置信域表达式 核心特点
UMA置信下限 \(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta>\theta_0\) UMPT(一致最优检验) \(\left[ \displaystyle \frac{2\sum_{i=1}^n X_i}{\chi^2(2n, 1-\alpha)}, +\infty \right)\) 包含非真实参数的概率一致最小,平均低估损失最小
严格UMAU置信区间 \(H_0:\theta=\theta_0 \leftrightarrow H_1:\theta \neq \theta_0\) UMPUT(一致最优无偏检验) \(\left( \displaystyle \frac{2\sum_{i=1}^n X_i}{c_2}, \frac{2\sum_{i=1}^n X_i}{c_1} \right)\)\(c_1,c_2由无偏检验方程组确定\) 无偏置信域中平均长度最短,包含非真实参数的概率最小
实用等尾置信区间 双侧检验 近似无偏检验 \(\left[ \displaystyle \frac{2\sum_{i=1}^n X_i}{\chi^2(2n, 1-\alpha/2)}, \frac{2\sum_{i=1}^n X_i}{\chi^2(2n, \alpha/2)} \right]\) 计算便捷,大样本下与严格UMAU区间一致,工程应用最广

六、本例核心启示

  1. 单侧置信限的最优性极易获得:单调似然比分布族的单侧检验存在UMPT,直接通过对偶关系即可得到UMA置信限,无需额外推导。
  2. 双侧最优置信区间的难点在于临界值求解:指数族双侧检验的UMPUT需要求解积分方程组,实际应用中通常用等尾区间近似。
  3. 对偶关系的核心价值:无需重复推导区间估计的最优性,直接复用假设检验的最优性结论,即可得到对应的最优置信域,大幅简化了统计推断的流程。

posted on 2026-02-27 19:57  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航