昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

7.1.2枢轴量法构造置信区间

枢轴量法构造置信区间 深度讲解与完整推导

作为深耕数理统计领域多年的研究员,我将从核心原理、步骤拆解、逐例严谨推导、误区澄清、结构化总结五个维度,完整讲解构造置信区间的核心方法——枢轴量法,确保每一步逻辑清晰、推导无跳步,彻底解决初学者的理解难点。


一、构造置信区间的方法概述

置信区间的核心是找到满足覆盖概率要求的随机区间,主流构造方法分为三类:

  1. 精确枢轴量法:从参数的优良点估计出发构造枢轴量,得到精确满足覆盖概率的置信区间,适用于总体分布已知的小样本场景,是本节的核心。
  2. 大样本近似枢轴量法:利用中心极限定理构造渐近分布已知的枢轴量,得到近似置信区间,适用于总体分布未知、样本量充足的场景。
  3. 假设检验接受域反推法:利用区间估计与假设检验的对偶性,通过检验的接受域反解得到置信区间/域,后续章节会详细讲解。

二、枢轴量法的核心原理与通用步骤

2.1 核心概念辨析:枢轴量 vs 统计量

这是90%初学者的核心混淆点,必须先明确区分:

概念 定义要求 核心区别
统计量 完全由样本决定,不能包含任何未知参数 仅提取样本信息,不含未知参数,用于点估计
枢轴量 必须同时满足两个条件:
① 是样本\(X\)和未知参数\(\theta\)的函数(必须包含\(\theta\));
② 概率分布完全已知,且与未知参数\(\theta\)无关
包含未知参数,但分布与参数无关,是连接样本与未知参数的“桥梁”

核心逻辑:只有枢轴量的分布与\(\theta\)无关,我们才能找到固定的、不依赖于\(\theta\)的分位数,进而通过不等式反解得到置信区间。

2.2 枢轴量法的三大通用步骤(每步含逻辑与注意事项)

步骤1:构造合适的枢轴量\(G(X,\theta)\)

  • 核心动作:从\(\theta\)优良点估计(优先选充分统计量、极大似然估计、无偏估计)出发,构造包含\(\theta\)和估计量的函数,使其满足枢轴量的两个核心条件。
  • 为什么从点估计出发? 充分统计量已经捕捉了样本中关于\(\theta\)的全部信息,基于它构造的置信区间是同置信水平下精度最高(平均长度最短)的区间。
  • 关键要求\(G(X,\theta)\)关于\(\theta\)必须是严格单调函数(严格递增/递减),这是后续不等式等价反解的前提,确保变形不改变事件的概率。

步骤2:确定分位数\(a,b\),满足覆盖概率要求

  • 核心动作:根据\(G(X,\theta)\)的已知分布,找到常数\(a,b\),使得:

    \[P_\theta\left\{a \leq G(X,\theta) \leq b\right\} = 1-\alpha, \quad \forall \theta \in \Theta \]

    其中\(1-\alpha\)为预先设定的置信水平。
  • 分位数选择原则
    1. 对称分布(正态、t分布):选等尾分位数\(a=\)分布的\(\alpha/2\)分位数,\(b=\)分布的\(1-\alpha/2\)分位数),此时区间长度最短,也是最常用的选择。
    2. 非对称分布(卡方、F、Gamma分布):等尾分位数是最易计算的常用选择;若需最优区间,需在约束\(P(G<a)+P(G>b)=\alpha\)下求解最短区间。
    3. 单侧置信限:仅需取单边分位数,如求置信下限取\(P(G \leq b)=1-\alpha\),求置信上限取\(P(G \geq a)=1-\alpha\)

步骤3:不等式等价反解,得到置信区间

  • 核心动作:将\(a \leq G(X,\theta) \leq b\)等价变形为关于\(\theta\)的不等式\(\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\),此时有:

    \[P_\theta\left\{\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\right\} = 1-\alpha \]

    \([\underline{\theta}(X), \overline{\theta}(X)]\)即为\(\theta\)的置信水平为\(1-\alpha\)的置信区间。
  • 关键注意事项
    • \(G\)关于\(\theta\)严格递增:反解后不等号方向不变;
    • \(G\)关于\(\theta\)严格递减:反解后不等号方向必须反转,这是初学者最易出错的点。

三、核心例题的完整推导与讲解

例7.1.1 正态总体\(N(\mu,\sigma^2)\)均值\(\mu\)的置信区间

题目:设\(X_1,X_2,\dots,X_n\)是来自\(N(\mu,\sigma^2)\)的独立同分布样本,求\(\mu\)的置信水平为\(1-\alpha\)的置信区间。

情况1:总体方差\(\sigma=\sigma_0\)已知

步骤1:构造枢轴量

\(\mu\)的优良点估计是样本均值\(\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\),由正态分布性质:\(\bar{X} \sim N\left(\mu, \frac{\sigma_0^2}{n}\right)\),标准化后得到:

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} \]

  • 验证:包含未知参数\(\mu\),分布为标准正态\(N(0,1)\),完全已知且与\(\mu\)无关,是枢轴量;且\(G\)关于\(\mu\)严格递减。
步骤2:确定分位数

标准正态是对称分布,取等尾分位数\(z_{\alpha/2}=-z_{1-\alpha/2}\),满足:

\[P_\mu\left\{ -z_{1-\alpha/2} \leq \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} \leq z_{1-\alpha/2} \right\} = 1-\alpha \]

步骤3:不等式反解

对不等式三边做等价变形:

  1. 乘以\(\sigma_0/\sqrt{n}\)(正数,不等号方向不变):

    \[-z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \bar{X}-\mu \leq z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]

  2. 减去\(\bar{X}\),再乘以-1(不等号反转):

    \[\bar{X} - z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]

因此,\(\sigma\)已知时,\(\mu\)\(1-\alpha\)双侧置信区间为:

\[\left[ \bar{X} - z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}}, \bar{X} + z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \right] \]

情况2:总体方差\(\sigma^2\)未知

\(\sigma\)未知时,上述枢轴量包含未知参数\(\sigma\),不再是枢轴量,因此用样本标准差\(S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2}\)代替\(\sigma\),构造新的枢轴量。

步骤1:构造枢轴量

由正态分布的核心性质:

  1. \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\)
  2. \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)(自由度为\(n-1\)的卡方分布);
  3. \(\bar{X}\)\(S^2\)相互独立。

根据t分布的定义\(T=\frac{Z}{\sqrt{W/k}} \sim t(k)\)\(Z\sim N(0,1)\)\(W\sim\chi^2(k)\),独立),代入得:

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1) \]

  • 验证:包含未知参数\(\mu\),分布为自由度\(n-1\)的t分布,完全已知且与\(\mu、\sigma\)无关,是枢轴量;\(G\)关于\(\mu\)严格递减。
步骤2:确定分位数

t分布是对称分布,取等尾分位数\(t_{1-\alpha/2}(n-1)\),满足:

\[P_\mu\left\{ -t_{1-\alpha/2}(n-1) \leq \frac{\sqrt{n}(\bar{X}-\mu)}{S} \leq t_{1-\alpha/2}(n-1) \right\} = 1-\alpha \]

步骤3:不等式反解

\(\sigma\)已知的情况完全类似,反解得:

\[\bar{X} - t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \leq \mu \leq \bar{X} + t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \]

因此,\(\sigma\)未知时,\(\mu\)\(1-\alpha\)双侧置信区间为:

\[\left[ \bar{X} - t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}, \bar{X} + t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \right] \]


例7.1.2 Gamma分布\(\Gamma(1/\theta,1)\)参数\(\theta\)的置信下限

题目:设\(X_1,X_2,\dots,X_n\)是来自\(\Gamma(1/\theta,1)\)(尺度参数化Gamma分布,平均寿命为\(1/\theta\))的独立同分布样本,求\(\theta\)的置信水平为\(1-\alpha\)的置信下限。

步骤1:构造枢轴量

\(\theta\)的充分统计量为\(T(X)=\sum_{i=1}^n X_i\),由Gamma分布可加性:\(T(X) \sim \Gamma(1/\theta, n)\)。利用Gamma分布与卡方分布的关系,构造:

\[G(X,\theta) = \frac{2T(X)}{\theta} \sim \chi^2(2n) \]

  • 验证:包含未知参数\(\theta\),分布为自由度\(2n\)的卡方分布,完全已知且与\(\theta\)无关,是枢轴量;\(G\)关于\(\theta\)严格递减。
步骤2:确定单边分位数

求置信下限需满足\(P(\theta \geq \underline{\theta}(X))=1-\alpha\),因此取单边分位数:

\[P_\theta\left\{ \frac{2T(X)}{\theta} < \chi^2_{1-\alpha}(2n) \right\} = 1-\alpha \]

其中\(\chi^2_p(k)\)为自由度\(k\)的卡方分布\(p\)分位数。

步骤3:不等式反解

对不等式\(\frac{2T(X)}{\theta} < \chi^2_{1-\alpha}(2n)\)做等价变形:

  1. 两边乘以\(\theta\)(正数,不等号不变):\(2T(X) < \chi^2_{1-\alpha}(2n) \cdot \theta\)
  2. 两边除以\(\chi^2_{1-\alpha}(2n)\)\(\theta > \frac{2T(X)}{\chi^2_{1-\alpha}(2n)}\)

因此,\(\theta\)\(1-\alpha\)置信下限为:

\[\underline{\theta}(X) = \frac{2T(X)}{\chi^2_{1-\alpha}(2n)} \]


例7.1.3 均匀分布\(R(0,\theta)\)参数\(\theta\)的置信区间

题目:设\(X_1,X_2,\dots,X_n\)是来自均匀分布\(R(0,\theta)\)的独立同分布样本,求\(\theta\)的置信水平为\(1-\alpha\)的置信区间。

步骤1:构造枢轴量

\(\theta\)的充分完备统计量是次序统计量\(X_{(n)} = \max\{X_1,\dots,X_n\}\),其分布函数为\(F_{X_{(n)}}(x) = (x/\theta)^n, 0<x<\theta\)。构造:

\[G(X,\theta) = \frac{X_{(n)}}{\theta} \]

求G的分布:\(F_G(g) = P(X_{(n)}/\theta \leq g) = g^n, 0<g<1\),即\(G \sim BE(n,1)\)(Beta分布),完全已知且与\(\theta\)无关,是枢轴量;\(G\)关于\(\theta\)严格递减。

步骤2:确定分位数\(a,b\)

需找到\(0<a<b≤1\),满足:

\[P_\theta\left\{ a \leq \frac{X_{(n)}}{\theta} \leq b \right\} = \int_a^b n g^{n-1} dg = b^n - a^n = 1-\alpha \]

步骤3:不等式反解

\(a \leq X_{(n)}/\theta \leq b\)等价变形:

\[\frac{X_{(n)}}{b} \leq \theta \leq \frac{X_{(n)}}{a} \]

因此,\(\theta\)\(1-\alpha\)置信区间为\(\left[ \frac{X_{(n)}}{b}, \frac{X_{(n)}}{a} \right]\),其中\(b^n -a^n=1-\alpha\)

最优最短区间推导

区间长度\(L = X_{(n)}(1/a - 1/b)\),需在\(b^n -a^n=1-\alpha\)约束下最小化\(L\)。通过单调性分析可证:\(1/a -1/b\)\(b\)的严格递减函数,因此\(b=1\)\(L\)最小,此时\(a=\sqrt[n]{\alpha}\)

因此,\(\theta\)的最短\(1-\alpha\)置信区间为:

\[\left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right] \]


例7.1.4-例7.1.8题核心结论与推导逻辑

例题编号 分布场景 核心枢轴量 核心结论
例7.1.4 双参数指数分布\(X\sim\mu+\Gamma(1/\sigma,1)\) 1. \(G_1=2S(X)/\sigma \sim \chi^2(2n-2)\)
2. \(G_2=\frac{n(n-1)(X_{(1)}-\mu)}{S(X)} \sim F(2,2n-2)\)
\(\sigma\)\(1-\alpha\)置信区间:\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\)
\(\mu\)\(1-\alpha\)置信区间:\(\left[ X_{(1)} - \frac{F_{1-\alpha/2}S}{n(n-1)}, X_{(1)} - \frac{F_{\alpha/2}S}{n(n-1)} \right]\)
例7.1.5 多元正态分布\(Y\sim N(\mu,I_n)\) \(G(Y,\mu)=||Y-\mu||^2 \sim \chi^2(n)\) \(\mu\)\(1-\alpha\)置信域:以\(Y\)为中心、\(\sqrt{\chi^2_{1-\alpha}(n)}\)为半径的\(n\)维球
例7.1.6 指数分布寿命数据(例7.1.2的数值应用) 同例7.1.2 代入\(n=9,T=5320,\chi^2_{0.95}(18)=28.869\),得平均寿命置信下限368.6h
例7.1.7 正态分布滚珠直径数据(例7.1.1的数值应用) 同例7.1.1 方差已知时95%置信区间\([14.88,15.24]\);方差未知时\([14.76,15.36]\)
例7.1.8 定数截尾指数分布寿命数据 \(G=2T_{n,r}/\theta \sim \chi^2(2r)\) 平均寿命置信下限1065.44h;可靠度\(p=P(X>1100)\)的95%置信区间\([0.32,0.81]\)

例7.1.4 - 例7.1.8 完整详细推导过程

以下推导严格遵循枢轴量法三大核心步骤,每一步均明确分布依据、公式来源与变形逻辑,无任何跳步,确保初学者可完整复现。


例7.1.4 双参数指数分布的置信区间与联合置信域

题目

\(X_1,X_2,\dots,X_n\) 为独立同分布样本,且 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\)(位置-尺度双参数指数分布,即 \(X-\mu \sim \text{Exp}(1/\sigma)\),均值为 \(\sigma\)),求参数 \(\sigma\)\(\mu\) 的水平为 \(1-\alpha\) 的置信区间,以及二者的联合置信域。


前置核心性质(双参数指数分布)

  1. 分布密度:\(f(x;\mu,\sigma) = \frac{1}{\sigma}e^{-(x-\mu)/\sigma}, \ x\geq\mu, \ \sigma>0\)
  2. 充分统计量:由因子分解定理,充分完备统计量为 \(T=(X_{(1)}, S(X))\),其中:
    • \(X_{(1)} = \min\{X_1,X_2,\dots,X_n\}\)(最小次序统计量)
    • \(S(X) = \sum_{i=1}^n (X_i - X_{(1)})\)(样本离均差和)
  3. 分布与独立性:
    • \(X_{(1)} \sim \mu + \Gamma(n/\sigma, 1)\),即 \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\)
    • \(S(X) \sim \Gamma(1/\sigma, n-1)\)(Gamma分布,形状参数 \(n-1\),率参数 \(1/\sigma\)
    • \(X_{(1)}\)\(S(X)\) 相互独立

一、参数 \(\sigma\) 的置信区间推导

步骤1:构造枢轴量

基于 \(S(X)\) 的分布,构造函数:

\[G_1(X,\sigma) = \frac{2S(X)}{\sigma} \]

枢轴量验证

  • 包含未知参数 \(\sigma\)
  • 分布推导:若 \(Y \sim \Gamma(\lambda, k)\)(率参数 \(\lambda\),形状参数 \(k\)),则 \(2\lambda Y \sim \chi^2(2k)\)。此处 \(S(X) \sim \Gamma(1/\sigma, n-1)\),代入得 \(2\cdot(1/\sigma)\cdot S(X) \sim \chi^2(2(n-1))\),即 \(G_1 \sim \chi^2(2n-2)\),分布完全已知,与 \(\sigma、\mu\) 均无关;
  • \(G_1\) 关于 \(\sigma\) 严格单调递减,满足反解要求。

步骤2:确定分位数

卡方分布为非对称分布,取等尾分位数,记 \(\chi^2_p(k)\) 为自由度 \(k\) 的卡方分布的下 \(p\) 分位数(满足 \(P(\chi^2(k) \leq \chi^2_p(k))=p\)),则:

\[P\left\{ \chi^2_{\alpha/2}(2n-2) \leq \frac{2S(X)}{\sigma} \leq \chi^2_{1-\alpha/2}(2n-2) \right\} = 1-\alpha \]

原理:\(P(G_1 \leq \chi^2_{1-\alpha/2}) - P(G_1 \leq \chi^2_{\alpha/2}) = (1-\alpha/2) - \alpha/2 = 1-\alpha\)

步骤3:不等式等价反解

对不等式 \(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2}\) 做等价变形(所有项均为正数,乘除不改变不等号方向):

  1. 左侧不等式:\(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \implies \sigma \leq \frac{2S}{\chi^2_{\alpha/2}(2n-2)}\)
  2. 右侧不等式:\(\frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2} \implies \sigma \geq \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}\)

合并得:

\[P\left\{ \frac{2S(X)}{\chi^2_{1-\alpha/2}(2n-2)} \leq \sigma \leq \frac{2S(X)}{\chi^2_{\alpha/2}(2n-2)} \right\} = 1-\alpha \]

因此,\(\sigma\) 的水平为 \(1-\alpha\) 的置信区间为:

\[\boldsymbol{ C_\sigma(\alpha) = \left[ \frac{2S(X)}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S(X)}{\chi^2_{\alpha/2}(2n-2)} \right] } \]


二、参数 \(\mu\) 的置信区间推导

步骤1:构造枢轴量

基于 \(X_{(1)}\) 的分布,结合F分布的定义构造枢轴量。

  1. \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\),得 \(\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\)(指数分布与卡方分布的关系:\(\text{Exp}(\lambda) \sim \Gamma(1,\lambda)\),故 \(2\lambda Y \sim \chi^2(2)\));
  2. 已知 \(\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\),且与 \(\frac{2n(X_{(1)} - \mu)}{\sigma}\) 独立;
  3. F分布定义:若 \(U \sim \chi^2(k_1), V \sim \chi^2(k_2)\) 且独立,则 \(F = \frac{U/k_1}{V/k_2} \sim F(k_1,k_2)\)

代入 \(U=\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\)\(V=\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\)\(k_1=2, k_2=2n-2\),化简得:

\[G_2(X,\mu) = \frac{\frac{2n(X_{(1)} - \mu)}{\sigma}/2}{\frac{2S(X)}{\sigma}/(2n-2)} = \frac{n(n-1)(X_{(1)} - \mu)}{S(X)} \]

枢轴量验证

  • 包含未知参数 \(\mu\)\(\sigma\) 已完全约去;
  • 分布为 \(F(2, 2n-2)\),完全已知,与 \(\mu、\sigma\) 无关;
  • \(G_2\) 关于 \(\mu\) 严格单调递减,满足反解要求。

步骤2:确定分位数

F分布为非对称分布,取等尾分位数,记 \(F_p(k_1,k_2)\) 为自由度 \(k_1,k_2\) 的F分布的下 \(p\) 分位数,则:

\[P\left\{ F_{\alpha/2}(2,2n-2) \leq \frac{n(n-1)(X_{(1)} - \mu)}{S(X)} \leq F_{1-\alpha/2}(2,2n-2) \right\} = 1-\alpha \]

步骤3:不等式等价反解

对不等式 \(F_{\alpha/2} \leq \frac{n(n-1)(X_{(1)} - \mu)}{S} \leq F_{1-\alpha/2}\) 做等价变形(\(n,S\) 均为正数,乘除不改变不等号方向):

  1. 两边乘 \(S\),除以 \(n(n-1)\)

    \[\frac{F_{\alpha/2} \cdot S}{n(n-1)} \leq X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} \cdot S}{n(n-1)} \]

  2. 解左侧不等式:\(\frac{F_{\alpha/2} S}{n(n-1)} \leq X_{(1)} - \mu \implies \mu \leq X_{(1)} - \frac{F_{\alpha/2} S}{n(n-1)}\)
  3. 解右侧不等式:\(X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} S}{n(n-1)} \implies \mu \geq X_{(1)} - \frac{F_{1-\alpha/2} S}{n(n-1)}\)(乘-1反转不等号)

合并得:

\[P\left\{ X_{(1)} - \frac{F_{1-\alpha/2} S}{n(n-1)} \leq \mu \leq X_{(1)} - \frac{F_{\alpha/2} S}{n(n-1)} \right\} = 1-\alpha \]

因此,\(\mu\) 的水平为 \(1-\alpha\) 的置信区间为:

\[\boldsymbol{ C_\mu(\alpha) = \left[ X_{(1)} - \frac{F_{1-\alpha/2}(2,2n-2) \cdot S(X)}{n(n-1)}, X_{(1)} - \frac{F_{\alpha/2}(2,2n-2) \cdot S(X)}{n(n-1)} \right] } \]


三、\(\mu\)\(\sigma\) 的联合置信域

根据引理7.1.2(置信域交运算性质):若 \(S_1,S_2\) 分别为参数 \(\theta_1,\theta_2\) 的水平 \(1-\alpha_1,1-\alpha_2\) 的置信域,则 \(S_1 \cap S_2\)\((\theta_1,\theta_2)\) 的水平 \(1-\alpha_1-\alpha_2\) 的置信域。

为得到水平 \(1-\alpha\) 的联合置信域,取 \(\alpha_1=\alpha_2=\alpha/2\),即:

  • \(\sigma\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\sigma(\alpha/2)\)
  • \(\mu\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\mu(\alpha/2)\)

则二者的笛卡尔积(交集)即为 \((\mu,\sigma)\) 的水平为 \(1-\alpha\) 的联合置信域:

\[\boldsymbol{ S(X) = \left\{ (\mu,\sigma): \mu \in C_\mu(\alpha/2), \sigma \in C_\sigma(\alpha/2) \right\} } \]


例7.1.5 多元正态分布均值向量的置信域

题目

\(Y=(Y_1,Y_2,\dots,Y_n)^T\) 服从多元正态分布 \(N(\mu, I_n)\),其中 \(I_n\)\(n\) 阶单位矩阵,求参数 \(\mu\) 的水平为 \(1-\alpha\) 的置信域。


完整推导

步骤1:构造枢轴量

多元正态分布核心性质:若 \(Y \sim N(\mu, \Sigma)\),则 \(Y-\mu \sim N(0, \Sigma)\)。本题中 \(\Sigma=I_n\),因此:

\[Y - \mu \sim N(0, I_n) \]

\(Y-\mu\) 的每个分量 \(Y_i - \mu_i \sim N(0,1)\),且相互独立。

卡方分布定义:独立标准正态变量的平方和服从卡方分布,即若 \(Z_1,\dots,Z_n \overset{i.i.d.}{\sim} N(0,1)\),则 \(\sum_{i=1}^n Z_i^2 \sim \chi^2(n)\)

因此构造枢轴量:

\[G(Y,\mu) = \|Y - \mu\|^2 = \sum_{i=1}^n (Y_i - \mu_i)^2 \]

枢轴量验证

  • 包含未知参数向量 \(\mu\)
  • 分布为 \(\chi^2(n)\),完全已知,与 \(\mu\) 无关,满足枢轴量要求。

步骤2:确定分位数

取卡方分布的下 \(1-\alpha\) 分位数 \(\chi^2_{1-\alpha}(n)\),满足:

\[P\left\{ \|Y - \mu\|^2 \leq \chi^2_{1-\alpha}(n) \right\} = 1-\alpha \]

步骤3:不等式反解得到置信域

不等式 \(\|Y - \mu\|^2 \leq \chi^2_{1-\alpha}(n)\) 直接定义了 \(\mu\) 的取值范围,因此 \(\mu\) 的水平为 \(1-\alpha\) 的置信域为:

\[\boldsymbol{ S(Y) = \left\{ \mu \in \mathbb{R}^n: \|\mu - Y\|^2 \leq \chi^2_{1-\alpha}(n) \right\} } \]

几何意义:该置信域是 \(n\) 维空间中,以观测向量 \(Y\) 为中心、以 \(\sqrt{\chi^2_{1-\alpha}(n)}\) 为半径的 \(n\) 维球体。


例7.1.6 指数分布寿命数据的置信下限(数值应用)

题目

某厂生产的产品寿命服从分布 \(\Gamma(1/\theta,1)\)(指数分布,均值为 \(\theta\)),观测到9个产品的寿命(单位:h):150, 450, 500, 530, 600, 650, 700, 830, 910,求其平均寿命的置信下限(置信水平0.95)。


完整推导

步骤1:确定分布与枢轴量

产品寿命 \(X \sim \text{Exp}(1/\theta)\),均值 \(E(X)=\theta\),样本 \(X_1,\dots,X_9\) 独立同分布。
由Gamma分布可加性,充分统计量 \(T(X) = \sum_{i=1}^9 X_i \sim \Gamma(1/\theta, 9)\),构造枢轴量:

\[G(X,\theta) = \frac{2T(X)}{\theta} \sim \chi^2(2\times9) = \chi^2(18) \]

分布与 \(\theta\) 无关,满足枢轴量要求。

步骤2:计算样本统计量与分位数

  1. 计算总寿命:\(T(X) = 150+450+500+530+600+650+700+830+910 = 5320\)
  2. 置信水平 \(1-\alpha=0.95\)\(\alpha=0.05\),查卡方分布表得 \(\chi^2_{0.95}(18)=28.869\),满足 \(P(G \leq 28.869)=0.95\)

步骤3:反解不等式求置信下限

\(P\left( \frac{2T(X)}{\theta} \leq 28.869 \right) = 0.95\),反解不等式:

\[\frac{2\times5320}{\theta} \leq 28.869 \implies \theta \geq \frac{10640}{28.869} \approx 368.6 \]

因此,这批产品平均寿命的95%置信下限为 \(\boldsymbol{368.6\ \text{h}}\)


例7.1.7 正态总体均值的置信区间(数值应用)

题目

某厂生产的滚珠直径服从正态分布,抽取6个样本,测得直径(单位:mm):14.70, 15.21, 14.90, 14.91, 15.32, 15.32。试估计直径平均值,并按以下两种情况求均值的95%置信区间:
(1) 方差已知为0.05;(2) 方差未知。


前置计算

样本量 \(n=6\),先计算样本均值:

\[\bar{X} = \frac{14.70+15.21+14.90+14.91+15.32+15.32}{6} = \frac{90.36}{6} = 15.06 \]


(1) 方差已知 \(\sigma^2=0.05\) 的置信区间推导

步骤1:构造枢轴量

滚珠直径 \(X \sim N(\mu, 0.05)\),样本均值 \(\bar{X} \sim N\left( \mu, \frac{0.05}{6} \right)\),标准化得枢轴量:

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} = \frac{\sqrt{6}(\bar{X}-\mu)}{\sqrt{0.05}} \sim N(0,1) \]

分布与 \(\mu\) 无关,满足枢轴量要求。

步骤2:确定分位数

置信水平0.95,\(\alpha=0.05\),标准正态分布的0.975分位数 \(z_{0.975}=1.96\),满足:

\[P(-1.96 \leq G \leq 1.96) = 0.95 \]

步骤3:反解不等式

\(-1.96 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{\sqrt{0.05}} \leq 1.96\) 反解,得:

\[\bar{X} - z_{0.975} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{0.975} \cdot \frac{\sigma_0}{\sqrt{n}} \]

代入数值计算:

  • 边际误差:\(1.96 \times \frac{\sqrt{0.05}}{\sqrt{6}} \approx 1.96 \times 0.0913 \approx 0.179\)
  • 下限:\(15.06 - 0.179 = 14.88\)
  • 上限:\(15.06 + 0.179 = 15.24\)

因此,方差已知时,均值的95%置信区间为 \(\boldsymbol{[14.88, 15.24]}\)


(2) 方差未知的置信区间推导

步骤1:构造枢轴量

方差未知时,用样本标准差 \(S\) 代替总体标准差 \(\sigma\),构造枢轴量:

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1) = t(5) \]

分布与 \(\mu、\sigma\) 无关,满足枢轴量要求。

步骤2:计算样本标准差与分位数

  1. 计算样本离均差平方和:

    \[\sum_{i=1}^6 (X_i - \bar{X})^2 = (14.70-15.06)^2 + \dots + (15.32-15.06)^2 = 0.3354 \]

  2. 样本方差:\(S^2 = \frac{1}{n-1}\sum (X_i-\bar{X})^2 = \frac{0.3354}{5} = 0.06708\),样本标准差 \(S = \sqrt{0.06708} \approx 0.259\)
  3. 置信水平0.95,自由度5,t分布的0.975分位数 \(t_{0.975}(5)=2.5706\),满足 \(P(-2.5706 \leq G \leq 2.5706)=0.95\)

步骤3:反解不等式

\(-2.5706 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{0.259} \leq 2.5706\) 反解,得:

\[\bar{X} - t_{0.975}(5) \cdot \frac{S}{\sqrt{n}} \leq \mu \leq \bar{X} + t_{0.975}(5) \cdot \frac{S}{\sqrt{n}} \]

代入数值计算:

  • 边际误差:\(2.5706 \times \frac{0.259}{\sqrt{6}} \approx 2.5706 \times 0.1057 \approx 0.2717\)
  • 下限:\(15.06 - 0.2717 = 14.76\)
  • 上限:\(15.06 + 0.2717 = 15.36\)

因此,方差未知时,均值的95%置信区间为 \(\boldsymbol{[14.76, 15.36]}\)


例7.1.8 定数截尾指数分布的置信区间

题目

某电子元件寿命服从 \(\Gamma(1/\theta,1)\)(指数分布,均值为 \(\theta\)),10个独立样本中,仅观测到前6个失效的寿命(单位:h):896, 950, 1005, 1100, 1150, 1220。
(1) 求这批元件平均寿命的95%置信下限;
(2) 设 \(p=P\{X_1>1100\}\),求 \(p\) 的95%置信区间。


前置核心性质(定数截尾指数分布)

\(n\) 个样本,定数截尾(观测到前 \(r\) 个失效),总试验时间为:

\[T_{n,r} = \sum_{i=1}^r X_{(i)} + (n-r)X_{(r)} \]

其中 \(X_{(1)}\leq X_{(2)}\leq \dots \leq X_{(r)}\) 为前 \(r\) 个次序统计量。对于指数分布,有 \(2T_{n,r}/\theta \sim \chi^2(2r)\),与完全样本的枢轴量仅自由度不同。


(1) 平均寿命的95%置信下限推导

步骤1:计算总试验时间

\(n=10, r=6\),前6个失效时间为896,950,1005,1100,1150,1220,因此:

\[\sum_{i=1}^6 X_{(i)} = 896+950+1005+1100+1150+1220 = 6321 \]

\[(n-r)X_{(r)} = (10-6)\times1220 = 4880 \]

\[T_{n,r} = 6321 + 4880 = 11201, \quad 2T_{n,r}=22402 \]

步骤2:构造枢轴量与确定分位数

枢轴量 \(G(X,\theta) = \frac{2T_{n,r}}{\theta} \sim \chi^2(2r) = \chi^2(12)\),分布与 \(\theta\) 无关。
置信水平0.95,\(\alpha=0.05\),查卡方分布表得 \(\chi^2_{0.95}(12)=21.026\),满足 \(P(G \leq 21.026)=0.95\)

步骤3:反解不等式求置信下限

\(P\left( \frac{2T_{n,r}}{\theta} \leq 21.026 \right) = 0.95\),反解得:

\[\theta \geq \frac{2T_{n,r}}{21.026} = \frac{22402}{21.026} \approx 1065.44 \]

因此,这批元件平均寿命的95%置信下限为 \(\boldsymbol{1065.44\ \text{h}}\)


(2) 可靠度 \(p=P\{X_1>1100\}\) 的置信区间推导

步骤1:建立 \(p\)\(\theta\) 的函数关系

指数分布的可靠度公式:

\[p = P\{X_1>1100\} = \int_{1100}^{+\infty} \frac{1}{\theta}e^{-x/\theta}dx = e^{-1100/\theta} \]

\(g(\theta)=e^{-1100/\theta}\),求导得 \(g'(\theta) = \frac{1100}{\theta^2}e^{-1100/\theta} > 0\),因此 \(g(\theta)\)\(\theta\)严格单调递增函数,满足引理7.1.1的条件。

步骤2:求 \(\theta\) 的95%双侧置信区间

用枢轴量 \(G=2T_{n,r}/\theta \sim \chi^2(12)\),取等尾分位数:

  • \(\chi^2_{0.025}(12)=4.404\)\(\chi^2_{0.975}(12)=23.337\)
  • 满足 \(P(4.404 \leq G \leq 23.337)=0.95\)

反解不等式得 \(\theta\) 的95%置信区间:

\[\frac{2T_{n,r}}{23.337} \leq \theta \leq \frac{2T_{n,r}}{4.404} \]

代入 \(2T_{n,r}=22402\),计算得:

\[\underline{\theta} = \frac{22402}{23.337} \approx 959.93, \quad \overline{\theta} = \frac{22402}{4.404} \approx 5086.74 \]

\(\theta\) 的95%置信区间为 \([959.93, 5086.74]\)

步骤3:变换得到 \(p\) 的置信区间

根据引理7.1.1,严格单调递增函数的置信区间为 \([g(\underline{\theta}), g(\overline{\theta})]\),代入计算:

  • 下限:\(g(\underline{\theta}) = e^{-1100/\overline{\theta}} = e^{-1100/5086.74} \approx e^{-0.216} \approx 0.81\)
  • 上限:\(g(\overline{\theta}) = e^{-1100/\underline{\theta}} = e^{-1100/959.93} \approx e^{-1.146} \approx 0.32\)

因此,\(p\) 的95%置信区间为 \(\boldsymbol{[0.32, 0.81]}\)


四、枢轴量法的常见误区澄清

  1. 误区1:把枢轴量当成统计量
    纠正:统计量不含任何未知参数,枢轴量必须包含未知参数\(\theta\),仅分布与\(\theta\)无关,二者本质不同。

  2. 误区2:构造的枢轴量分布与\(\theta\)有关
    纠正:若枢轴量的分布依赖\(\theta\),则分位数\(a,b\)会随\(\theta\)变化,无法反解得到固定的置信区间,这是构造枢轴量的核心禁忌。

  3. 误区3:反解不等式时忽略不等号方向
    纠正:若\(G\)关于\(\theta\)严格递减,反解时必须反转不等号,否则会得到完全错误的区间,甚至出现置信下限大于置信上限的情况。

  4. 误区4:认为“置信区间包含真值的概率是\(1-\alpha\)
    纠正:真值是固定常数,区间是随机的。正确表述为:重复抽样构造100个\(1-\alpha\)置信区间,约\(100(1-\alpha)\)个区间会包含真实参数,单个区间要么包含真值,要么不包含,无概率属性。


五、全知识点结构化归纳总结

表1 枢轴量法三大核心步骤总结

步骤 核心动作 关键要求 注意事项
1. 构造枢轴量 从参数的优良点估计出发,构造\(G(X,\theta)\) ① 包含未知参数\(\theta\);② 分布完全已知且与\(\theta\)无关;③ 关于\(\theta\)严格单调 优先基于充分统计量构造,保证区间最优性
2. 确定分位数 找到\(a,b\)满足\(P(a≤G≤b)=1-\alpha\) 对称分布选等尾分位数;非对称分布可选择等尾或最短区间分位数 单侧置信限仅需取单边分位数
3. 不等式反解 \(a≤G≤b\)等价变形为\(\underline{\theta}≤\theta≤\overline{\theta}\) 严格保证不等式等价,不改变事件概率 \(G\)关于\(\theta\)递减时,反解必须反转不等号

表2 常见分布的枢轴量与置信区间汇总

总体分布 待估参数 枢轴量 枢轴量分布 置信水平\(1-\alpha\)的置信区间/限
正态\(N(\mu,\sigma^2)\)\(\sigma\)已知) 均值\(\mu\) \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0}\) \(N(0,1)\) 双侧:\(\left[ \bar{X} \pm z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \right]\)
单侧下限:\(\bar{X} - z_{1-\alpha} \cdot \frac{\sigma_0}{\sqrt{n}}\)
正态\(N(\mu,\sigma^2)\)\(\sigma\)未知) 均值\(\mu\) \(\frac{\sqrt{n}(\bar{X}-\mu)}{S}\) \(t(n-1)\) 双侧:\(\left[ \bar{X} \pm t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \right]\)
指数分布\(\Gamma(1/\theta,1)\) 失效率\(\theta\) \(\frac{2\sum X_i}{\theta}\) \(\chi^2(2n)\) 单侧下限:\(\frac{2\sum X_i}{\chi^2_{1-\alpha}(2n)}\)
均匀分布\(R(0,\theta)\) 上限\(\theta\) \(\frac{X_{(n)}}{\theta}\) \(BE(n,1)\) 最短双侧:\(\left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right]\)
双参数指数分布 尺度参数\(\sigma\) \(\frac{2\sum (X_i-X_{(1)})}{\sigma}\) \(\chi^2(2n-2)\) 双侧:\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\)
多元正态\(N(\mu,I_n)\) 均值向量\(\mu\) \(||Y-\mu||^2\) \(\chi^2(n)\) 置信域:\(\{ \mu: ||\mu-Y||^2 ≤ \chi^2_{1-\alpha}(n) \}\)

表3 枢轴量与统计量的核心区别

对比维度 统计量 枢轴量
未知参数 完全不含未知参数 必须包含待估的未知参数\(\theta\)
分布特性 分布通常依赖未知参数\(\theta\) 分布完全已知,且与未知参数\(\theta\)无关
核心用途 用于参数的点估计、假设检验统计量构造 专门用于构造参数的置信区间/置信域
示例 样本均值\(\bar{X}\)、样本方差\(S^2\) \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\)\(\frac{2\sum X_i}{\theta}\)

posted on 2026-02-27 18:48  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航