夫君子之行，静以修身，俭以养德；非澹泊无以明志，非宁静无以致远。夫学须静也，才须学也；非学无以广才，非志无以成学。怠慢则不能励精，险躁则不能冶性。年与时驰，意与岁去，遂成枯落，多不接世。悲守穷庐，将复何及！

7.1.2枢轴量法构造置信区间

枢轴量法构造置信区间深度讲解与完整推导

作为深耕数理统计领域多年的研究员，我将从核心原理、步骤拆解、逐例严谨推导、误区澄清、结构化总结五个维度，完整讲解构造置信区间的核心方法——枢轴量法，确保每一步逻辑清晰、推导无跳步，彻底解决初学者的理解难点。

一、构造置信区间的方法概述

置信区间的核心是找到满足覆盖概率要求的随机区间，主流构造方法分为三类：

精确枢轴量法：从参数的优良点估计出发构造枢轴量，得到精确满足覆盖概率的置信区间，适用于总体分布已知的小样本场景，是本节的核心。
大样本近似枢轴量法：利用中心极限定理构造渐近分布已知的枢轴量，得到近似置信区间，适用于总体分布未知、样本量充足的场景。
假设检验接受域反推法：利用区间估计与假设检验的对偶性，通过检验的接受域反解得到置信区间/域，后续章节会详细讲解。

二、枢轴量法的核心原理与通用步骤

2.1 核心概念辨析：枢轴量 vs 统计量

这是90%初学者的核心混淆点，必须先明确区分：

概念	定义要求	核心区别
统计量	完全由样本决定，不能包含任何未知参数	仅提取样本信息，不含未知参数，用于点估计
枢轴量	必须同时满足两个条件： ① 是样本\(X\)和未知参数\(\theta\)的函数（必须包含\(\theta\)）； ② 概率分布完全已知，且与未知参数\(\theta\)无关	包含未知参数，但分布与参数无关，是连接样本与未知参数的“桥梁”

核心逻辑：只有枢轴量的分布与\(\theta\)无关，我们才能找到固定的、不依赖于\(\theta\)的分位数，进而通过不等式反解得到置信区间。

2.2 枢轴量法的三大通用步骤（每步含逻辑与注意事项）

步骤1：构造合适的枢轴量\(G(X,\theta)\)

核心动作：从\(\theta\)的优良点估计（优先选充分统计量、极大似然估计、无偏估计）出发，构造包含\(\theta\)和估计量的函数，使其满足枢轴量的两个核心条件。
为什么从点估计出发？ 充分统计量已经捕捉了样本中关于\(\theta\)的全部信息，基于它构造的置信区间是同置信水平下精度最高（平均长度最短）的区间。
关键要求：\(G(X,\theta)\)关于\(\theta\)必须是严格单调函数（严格递增/递减），这是后续不等式等价反解的前提，确保变形不改变事件的概率。

步骤2：确定分位数\(a,b\)，满足覆盖概率要求

核心动作：根据\(G(X,\theta)\)的已知分布，找到常数\(a,b\)，使得：
\[P_\theta\left\{a \leq G(X,\theta) \leq b\right\} = 1-\alpha, \quad \forall \theta \in \Theta \]
其中\(1-\alpha\)为预先设定的置信水平。
分位数选择原则：
1. 对称分布（正态、t分布）：选等尾分位数（\(a=\)分布的\(\alpha/2\)分位数，\(b=\)分布的\(1-\alpha/2\)分位数），此时区间长度最短，也是最常用的选择。
2. 非对称分布（卡方、F、Gamma分布）：等尾分位数是最易计算的常用选择；若需最优区间，需在约束\(P(G<a)+P(G>b)=\alpha\)下求解最短区间。
3. 单侧置信限：仅需取单边分位数，如求置信下限取\(P(G \leq b)=1-\alpha\)，求置信上限取\(P(G \geq a)=1-\alpha\)。

步骤3：不等式等价反解，得到置信区间

核心动作：将\(a \leq G(X,\theta) \leq b\)等价变形为关于\(\theta\)的不等式\(\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\)，此时有：
\[P_\theta\left\{\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\right\} = 1-\alpha \]
\([\underline{\theta}(X), \overline{\theta}(X)]\)即为\(\theta\)的置信水平为\(1-\alpha\)的置信区间。
关键注意事项：
- 若\(G\)关于\(\theta\)严格递增：反解后不等号方向不变；
- 若\(G\)关于\(\theta\)严格递减：反解后不等号方向必须反转，这是初学者最易出错的点。

三、核心例题的完整推导与讲解

例7.1.1 正态总体\(N(\mu,\sigma^2)\)均值\(\mu\)的置信区间

题目：设\(X_1,X_2,\dots,X_n\)是来自\(N(\mu,\sigma^2)\)的独立同分布样本，求\(\mu\)的置信水平为\(1-\alpha\)的置信区间。

情况1：总体方差\(\sigma=\sigma_0\)已知

步骤1：构造枢轴量

\(\mu\)的优良点估计是样本均值\(\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\)，由正态分布性质：\(\bar{X} \sim N\left(\mu, \frac{\sigma_0^2}{n}\right)\)，标准化后得到：

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} \]

验证：包含未知参数\(\mu\)，分布为标准正态\(N(0,1)\)，完全已知且与\(\mu\)无关，是枢轴量；且\(G\)关于\(\mu\)严格递减。

步骤2：确定分位数

标准正态是对称分布，取等尾分位数\(z_{\alpha/2}=-z_{1-\alpha/2}\)，满足：

\[P_\mu\left\{ -z_{1-\alpha/2} \leq \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} \leq z_{1-\alpha/2} \right\} = 1-\alpha \]

步骤3：不等式反解

对不等式三边做等价变形：

乘以\(\sigma_0/\sqrt{n}\)（正数，不等号方向不变）：
\[-z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \bar{X}-\mu \leq z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]
减去\(\bar{X}\)，再乘以-1（不等号反转）：
\[\bar{X} - z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]

因此，\(\sigma\)已知时，\(\mu\)的\(1-\alpha\)双侧置信区间为：

\[\left[ \bar{X} - z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}}, \bar{X} + z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \right] \]

情况2：总体方差\(\sigma^2\)未知

\(\sigma\)未知时，上述枢轴量包含未知参数\(\sigma\)，不再是枢轴量，因此用样本标准差\(S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2}\)代替\(\sigma\)，构造新的枢轴量。

步骤1：构造枢轴量

由正态分布的核心性质：

\(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\)；
\(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)（自由度为\(n-1\)的卡方分布）；
\(\bar{X}\)与\(S^2\)相互独立。

根据t分布的定义\(T=\frac{Z}{\sqrt{W/k}} \sim t(k)\)（\(Z\sim N(0,1)\)，\(W\sim\chi^2(k)\)，独立），代入得：

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1) \]

验证：包含未知参数\(\mu\)，分布为自由度\(n-1\)的t分布，完全已知且与\(\mu、\sigma\)无关，是枢轴量；\(G\)关于\(\mu\)严格递减。

步骤2：确定分位数

t分布是对称分布，取等尾分位数\(t_{1-\alpha/2}(n-1)\)，满足：

\[P_\mu\left\{ -t_{1-\alpha/2}(n-1) \leq \frac{\sqrt{n}(\bar{X}-\mu)}{S} \leq t_{1-\alpha/2}(n-1) \right\} = 1-\alpha \]

步骤3：不等式反解

与\(\sigma\)已知的情况完全类似，反解得：

\[\bar{X} - t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \leq \mu \leq \bar{X} + t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \]

因此，\(\sigma\)未知时，\(\mu\)的\(1-\alpha\)双侧置信区间为：

\[\left[ \bar{X} - t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}}, \bar{X} + t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \right] \]

例7.1.2 Gamma分布\(\Gamma(1/\theta,1)\)参数\(\theta\)的置信下限

题目：设\(X_1,X_2,\dots,X_n\)是来自\(\Gamma(1/\theta,1)\)（尺度参数化Gamma分布，平均寿命为\(1/\theta\)）的独立同分布样本，求\(\theta\)的置信水平为\(1-\alpha\)的置信下限。

步骤1：构造枢轴量

\(\theta\)的充分统计量为\(T(X)=\sum_{i=1}^n X_i\)，由Gamma分布可加性：\(T(X) \sim \Gamma(1/\theta, n)\)。利用Gamma分布与卡方分布的关系，构造：

\[G(X,\theta) = \frac{2T(X)}{\theta} \sim \chi^2(2n) \]

验证：包含未知参数\(\theta\)，分布为自由度\(2n\)的卡方分布，完全已知且与\(\theta\)无关，是枢轴量；\(G\)关于\(\theta\)严格递减。

步骤2：确定单边分位数

求置信下限需满足\(P(\theta \geq \underline{\theta}(X))=1-\alpha\)，因此取单边分位数：

\[P_\theta\left\{ \frac{2T(X)}{\theta} < \chi^2_{1-\alpha}(2n) \right\} = 1-\alpha \]

其中\(\chi^2_p(k)\)为自由度\(k\)的卡方分布\(p\)分位数。

步骤3：不等式反解

对不等式\(\frac{2T(X)}{\theta} < \chi^2_{1-\alpha}(2n)\)做等价变形：

两边乘以\(\theta\)（正数，不等号不变）：\(2T(X) < \chi^2_{1-\alpha}(2n) \cdot \theta\)
两边除以\(\chi^2_{1-\alpha}(2n)\)：\(\theta > \frac{2T(X)}{\chi^2_{1-\alpha}(2n)}\)

因此，\(\theta\)的\(1-\alpha\)置信下限为：

\[\underline{\theta}(X) = \frac{2T(X)}{\chi^2_{1-\alpha}(2n)} \]

例7.1.3 均匀分布\(R(0,\theta)\)参数\(\theta\)的置信区间

题目：设\(X_1,X_2,\dots,X_n\)是来自均匀分布\(R(0,\theta)\)的独立同分布样本，求\(\theta\)的置信水平为\(1-\alpha\)的置信区间。

步骤1：构造枢轴量

\(\theta\)的充分完备统计量是次序统计量\(X_{(n)} = \max\{X_1,\dots,X_n\}\)，其分布函数为\(F_{X_{(n)}}(x) = (x/\theta)^n, 0<x<\theta\)。构造：

\[G(X,\theta) = \frac{X_{(n)}}{\theta} \]

求G的分布：\(F_G(g) = P(X_{(n)}/\theta \leq g) = g^n, 0<g<1\)，即\(G \sim BE(n,1)\)（Beta分布），完全已知且与\(\theta\)无关，是枢轴量；\(G\)关于\(\theta\)严格递减。

步骤2：确定分位数\(a,b\)

需找到\(0<a<b≤1\)，满足：

\[P_\theta\left\{ a \leq \frac{X_{(n)}}{\theta} \leq b \right\} = \int_a^b n g^{n-1} dg = b^n - a^n = 1-\alpha \]

步骤3：不等式反解

对\(a \leq X_{(n)}/\theta \leq b\)等价变形：

\[\frac{X_{(n)}}{b} \leq \theta \leq \frac{X_{(n)}}{a} \]

因此，\(\theta\)的\(1-\alpha\)置信区间为\(\left[ \frac{X_{(n)}}{b}, \frac{X_{(n)}}{a} \right]\)，其中\(b^n -a^n=1-\alpha\)。

最优最短区间推导

区间长度\(L = X_{(n)}(1/a - 1/b)\)，需在\(b^n -a^n=1-\alpha\)约束下最小化\(L\)。通过单调性分析可证：\(1/a -1/b\)是\(b\)的严格递减函数，因此\(b=1\)时\(L\)最小，此时\(a=\sqrt[n]{\alpha}\)。

因此，\(\theta\)的最短\(1-\alpha\)置信区间为：

\[\left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right] \]

例7.1.4-例7.1.8题核心结论与推导逻辑

例题编号	分布场景	核心枢轴量	核心结论
例7.1.4	双参数指数分布\(X\sim\mu+\Gamma(1/\sigma,1)\)	1. \(G_1=2S(X)/\sigma \sim \chi^2(2n-2)\) 2. \(G_2=\frac{n(n-1)(X_{(1)}-\mu)}{S(X)} \sim F(2,2n-2)\)	\(\sigma\)的\(1-\alpha\)置信区间：\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\) \(\mu\)的\(1-\alpha\)置信区间：\(\left[ X_{(1)} - \frac{F_{1-\alpha/2}S}{n(n-1)}, X_{(1)} - \frac{F_{\alpha/2}S}{n(n-1)} \right]\)
例7.1.5	多元正态分布\(Y\sim N(\mu,I_n)\)	\(G(Y,\mu)=\|\|Y-\mu\|\|^2 \sim \chi^2(n)\)	\(\mu\)的\(1-\alpha\)置信域：以\(Y\)为中心、\(\sqrt{\chi^2_{1-\alpha}(n)}\)为半径的\(n\)维球
例7.1.6	指数分布寿命数据（例7.1.2的数值应用）	同例7.1.2	代入\(n=9,T=5320,\chi^2_{0.95}(18)=28.869\)，得平均寿命置信下限368.6h
例7.1.7	正态分布滚珠直径数据（例7.1.1的数值应用）	同例7.1.1	方差已知时95%置信区间\([14.88,15.24]\)；方差未知时\([14.76,15.36]\)
例7.1.8	定数截尾指数分布寿命数据	\(G=2T_{n,r}/\theta \sim \chi^2(2r)\)	平均寿命置信下限1065.44h；可靠度\(p=P(X>1100)\)的95%置信区间\([0.32,0.81]\)

例7.1.4 - 例7.1.8 完整详细推导过程

以下推导严格遵循枢轴量法三大核心步骤，每一步均明确分布依据、公式来源与变形逻辑，无任何跳步，确保初学者可完整复现。

例7.1.4 双参数指数分布的置信区间与联合置信域

题目

设 \(X_1,X_2,\dots,X_n\) 为独立同分布样本，且 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\)（位置-尺度双参数指数分布，即 \(X-\mu \sim \text{Exp}(1/\sigma)\)，均值为 \(\sigma\)），求参数 \(\sigma\) 和 \(\mu\) 的水平为 \(1-\alpha\) 的置信区间，以及二者的联合置信域。

前置核心性质（双参数指数分布）

分布密度：\(f(x;\mu,\sigma) = \frac{1}{\sigma}e^{-(x-\mu)/\sigma}, \ x\geq\mu, \ \sigma>0\)
充分统计量：由因子分解定理，充分完备统计量为 \(T=(X_{(1)}, S(X))\)，其中：
- \(X_{(1)} = \min\{X_1,X_2,\dots,X_n\}\)（最小次序统计量）
- \(S(X) = \sum_{i=1}^n (X_i - X_{(1)})\)（样本离均差和）
分布与独立性：
- \(X_{(1)} \sim \mu + \Gamma(n/\sigma, 1)\)，即 \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\)
- \(S(X) \sim \Gamma(1/\sigma, n-1)\)（Gamma分布，形状参数 \(n-1\)，率参数 \(1/\sigma\)）
- \(X_{(1)}\) 与 \(S(X)\) 相互独立

一、参数 \(\sigma\) 的置信区间推导

步骤1：构造枢轴量

基于 \(S(X)\) 的分布，构造函数：

\[G_1(X,\sigma) = \frac{2S(X)}{\sigma} \]

枢轴量验证：

包含未知参数 \(\sigma\)；
分布推导：若 \(Y \sim \Gamma(\lambda, k)\)（率参数 \(\lambda\)，形状参数 \(k\)），则 \(2\lambda Y \sim \chi^2(2k)\)。此处 \(S(X) \sim \Gamma(1/\sigma, n-1)\)，代入得 \(2\cdot(1/\sigma)\cdot S(X) \sim \chi^2(2(n-1))\)，即 \(G_1 \sim \chi^2(2n-2)\)，分布完全已知，与 \(\sigma、\mu\) 均无关；
\(G_1\) 关于 \(\sigma\) 严格单调递减，满足反解要求。

步骤2：确定分位数

卡方分布为非对称分布，取等尾分位数，记 \(\chi^2_p(k)\) 为自由度 \(k\) 的卡方分布的下 \(p\) 分位数（满足 \(P(\chi^2(k) \leq \chi^2_p(k))=p\)），则：

\[P\left\{ \chi^2_{\alpha/2}(2n-2) \leq \frac{2S(X)}{\sigma} \leq \chi^2_{1-\alpha/2}(2n-2) \right\} = 1-\alpha \]

原理：\(P(G_1 \leq \chi^2_{1-\alpha/2}) - P(G_1 \leq \chi^2_{\alpha/2}) = (1-\alpha/2) - \alpha/2 = 1-\alpha\)。

步骤3：不等式等价反解

对不等式 \(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2}\) 做等价变形（所有项均为正数，乘除不改变不等号方向）：

左侧不等式：\(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \implies \sigma \leq \frac{2S}{\chi^2_{\alpha/2}(2n-2)}\)
右侧不等式：\(\frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2} \implies \sigma \geq \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}\)

合并得：

\[P\left\{ \frac{2S(X)}{\chi^2_{1-\alpha/2}(2n-2)} \leq \sigma \leq \frac{2S(X)}{\chi^2_{\alpha/2}(2n-2)} \right\} = 1-\alpha \]

因此，\(\sigma\) 的水平为 \(1-\alpha\) 的置信区间为：

\[\boldsymbol{ C_\sigma(\alpha) = \left[ \frac{2S(X)}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S(X)}{\chi^2_{\alpha/2}(2n-2)} \right] } \]

二、参数 \(\mu\) 的置信区间推导

步骤1：构造枢轴量

基于 \(X_{(1)}\) 的分布，结合F分布的定义构造枢轴量。

由 \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\)，得 \(\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\)（指数分布与卡方分布的关系：\(\text{Exp}(\lambda) \sim \Gamma(1,\lambda)\)，故 \(2\lambda Y \sim \chi^2(2)\)）；
已知 \(\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\)，且与 \(\frac{2n(X_{(1)} - \mu)}{\sigma}\) 独立；
F分布定义：若 \(U \sim \chi^2(k_1), V \sim \chi^2(k_2)\) 且独立，则 \(F = \frac{U/k_1}{V/k_2} \sim F(k_1,k_2)\)。

代入 \(U=\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\)，\(V=\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\)，\(k_1=2, k_2=2n-2\)，化简得：

\[G_2(X,\mu) = \frac{\frac{2n(X_{(1)} - \mu)}{\sigma}/2}{\frac{2S(X)}{\sigma}/(2n-2)} = \frac{n(n-1)(X_{(1)} - \mu)}{S(X)} \]

枢轴量验证：

包含未知参数 \(\mu\)，\(\sigma\) 已完全约去；
分布为 \(F(2, 2n-2)\)，完全已知，与 \(\mu、\sigma\) 无关；
\(G_2\) 关于 \(\mu\) 严格单调递减，满足反解要求。

步骤2：确定分位数

F分布为非对称分布，取等尾分位数，记 \(F_p(k_1,k_2)\) 为自由度 \(k_1,k_2\) 的F分布的下 \(p\) 分位数，则：

\[P\left\{ F_{\alpha/2}(2,2n-2) \leq \frac{n(n-1)(X_{(1)} - \mu)}{S(X)} \leq F_{1-\alpha/2}(2,2n-2) \right\} = 1-\alpha \]

步骤3：不等式等价反解

对不等式 \(F_{\alpha/2} \leq \frac{n(n-1)(X_{(1)} - \mu)}{S} \leq F_{1-\alpha/2}\) 做等价变形（\(n,S\) 均为正数，乘除不改变不等号方向）：

两边乘 \(S\)，除以 \(n(n-1)\)：
\[\frac{F_{\alpha/2} \cdot S}{n(n-1)} \leq X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} \cdot S}{n(n-1)} \]
解左侧不等式：\(\frac{F_{\alpha/2} S}{n(n-1)} \leq X_{(1)} - \mu \implies \mu \leq X_{(1)} - \frac{F_{\alpha/2} S}{n(n-1)}\)
解右侧不等式：\(X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} S}{n(n-1)} \implies \mu \geq X_{(1)} - \frac{F_{1-\alpha/2} S}{n(n-1)}\)（乘-1反转不等号）

合并得：

\[P\left\{ X_{(1)} - \frac{F_{1-\alpha/2} S}{n(n-1)} \leq \mu \leq X_{(1)} - \frac{F_{\alpha/2} S}{n(n-1)} \right\} = 1-\alpha \]

因此，\(\mu\) 的水平为 \(1-\alpha\) 的置信区间为：

\[\boldsymbol{ C_\mu(\alpha) = \left[ X_{(1)} - \frac{F_{1-\alpha/2}(2,2n-2) \cdot S(X)}{n(n-1)}, X_{(1)} - \frac{F_{\alpha/2}(2,2n-2) \cdot S(X)}{n(n-1)} \right] } \]

三、\(\mu\) 与 \(\sigma\) 的联合置信域

根据引理7.1.2（置信域交运算性质）：若 \(S_1,S_2\) 分别为参数 \(\theta_1,\theta_2\) 的水平 \(1-\alpha_1,1-\alpha_2\) 的置信域，则 \(S_1 \cap S_2\) 为 \((\theta_1,\theta_2)\) 的水平 \(1-\alpha_1-\alpha_2\) 的置信域。

为得到水平 \(1-\alpha\) 的联合置信域，取 \(\alpha_1=\alpha_2=\alpha/2\)，即：

\(\sigma\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\sigma(\alpha/2)\)
\(\mu\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\mu(\alpha/2)\)

则二者的笛卡尔积（交集）即为 \((\mu,\sigma)\) 的水平为 \(1-\alpha\) 的联合置信域：

\[\boldsymbol{ S(X) = \left\{ (\mu,\sigma): \mu \in C_\mu(\alpha/2), \sigma \in C_\sigma(\alpha/2) \right\} } \]

例7.1.5 多元正态分布均值向量的置信域

题目

\(Y=(Y_1,Y_2,\dots,Y_n)^T\) 服从多元正态分布 \(N(\mu, I_n)\)，其中 \(I_n\) 为 \(n\) 阶单位矩阵，求参数 \(\mu\) 的水平为 \(1-\alpha\) 的置信域。

完整推导

步骤1：构造枢轴量

多元正态分布核心性质：若 \(Y \sim N(\mu, \Sigma)\)，则 \(Y-\mu \sim N(0, \Sigma)\)。本题中 \(\Sigma=I_n\)，因此：

\[Y - \mu \sim N(0, I_n) \]

即 \(Y-\mu\) 的每个分量 \(Y_i - \mu_i \sim N(0,1)\)，且相互独立。

卡方分布定义：独立标准正态变量的平方和服从卡方分布，即若 \(Z_1,\dots,Z_n \overset{i.i.d.}{\sim} N(0,1)\)，则 \(\sum_{i=1}^n Z_i^2 \sim \chi^2(n)\)。

因此构造枢轴量：

\[G(Y,\mu) = \|Y - \mu\|^2 = \sum_{i=1}^n (Y_i - \mu_i)^2 \]

枢轴量验证：

包含未知参数向量 \(\mu\)；
分布为 \(\chi^2(n)\)，完全已知，与 \(\mu\) 无关，满足枢轴量要求。

步骤2：确定分位数

取卡方分布的下 \(1-\alpha\) 分位数 \(\chi^2_{1-\alpha}(n)\)，满足：

\[P\left\{ \|Y - \mu\|^2 \leq \chi^2_{1-\alpha}(n) \right\} = 1-\alpha \]

步骤3：不等式反解得到置信域

不等式 \(\|Y - \mu\|^2 \leq \chi^2_{1-\alpha}(n)\) 直接定义了 \(\mu\) 的取值范围，因此 \(\mu\) 的水平为 \(1-\alpha\) 的置信域为：

\[\boldsymbol{ S(Y) = \left\{ \mu \in \mathbb{R}^n: \|\mu - Y\|^2 \leq \chi^2_{1-\alpha}(n) \right\} } \]

几何意义：该置信域是 \(n\) 维空间中，以观测向量 \(Y\) 为中心、以 \(\sqrt{\chi^2_{1-\alpha}(n)}\) 为半径的 \(n\) 维球体。

例7.1.6 指数分布寿命数据的置信下限（数值应用）

题目

某厂生产的产品寿命服从分布 \(\Gamma(1/\theta,1)\)（指数分布，均值为 \(\theta\)），观测到9个产品的寿命（单位：h）：150, 450, 500, 530, 600, 650, 700, 830, 910，求其平均寿命的置信下限（置信水平0.95）。

完整推导

步骤1：确定分布与枢轴量

产品寿命 \(X \sim \text{Exp}(1/\theta)\)，均值 \(E(X)=\theta\)，样本 \(X_1,\dots,X_9\) 独立同分布。
由Gamma分布可加性，充分统计量 \(T(X) = \sum_{i=1}^9 X_i \sim \Gamma(1/\theta, 9)\)，构造枢轴量：

\[G(X,\theta) = \frac{2T(X)}{\theta} \sim \chi^2(2\times9) = \chi^2(18) \]

分布与 \(\theta\) 无关，满足枢轴量要求。

步骤2：计算样本统计量与分位数

计算总寿命：\(T(X) = 150+450+500+530+600+650+700+830+910 = 5320\)
置信水平 \(1-\alpha=0.95\)，\(\alpha=0.05\)，查卡方分布表得 \(\chi^2_{0.95}(18)=28.869\)，满足 \(P(G \leq 28.869)=0.95\)。

步骤3：反解不等式求置信下限

由 \(P\left( \frac{2T(X)}{\theta} \leq 28.869 \right) = 0.95\)，反解不等式：

\[\frac{2\times5320}{\theta} \leq 28.869 \implies \theta \geq \frac{10640}{28.869} \approx 368.6 \]

因此，这批产品平均寿命的95%置信下限为 \(\boldsymbol{368.6\ \text{h}}\)。

例7.1.7 正态总体均值的置信区间（数值应用）

题目

某厂生产的滚珠直径服从正态分布，抽取6个样本，测得直径（单位：mm）：14.70, 15.21, 14.90, 14.91, 15.32, 15.32。试估计直径平均值，并按以下两种情况求均值的95%置信区间：
(1) 方差已知为0.05；(2) 方差未知。

前置计算

样本量 \(n=6\)，先计算样本均值：

\[\bar{X} = \frac{14.70+15.21+14.90+14.91+15.32+15.32}{6} = \frac{90.36}{6} = 15.06 \]

(1) 方差已知 \(\sigma^2=0.05\) 的置信区间推导

步骤1：构造枢轴量

滚珠直径 \(X \sim N(\mu, 0.05)\)，样本均值 \(\bar{X} \sim N\left( \mu, \frac{0.05}{6} \right)\)，标准化得枢轴量：

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0} = \frac{\sqrt{6}(\bar{X}-\mu)}{\sqrt{0.05}} \sim N(0,1) \]

分布与 \(\mu\) 无关，满足枢轴量要求。

步骤2：确定分位数

置信水平0.95，\(\alpha=0.05\)，标准正态分布的0.975分位数 \(z_{0.975}=1.96\)，满足：

\[P(-1.96 \leq G \leq 1.96) = 0.95 \]

步骤3：反解不等式

对 \(-1.96 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{\sqrt{0.05}} \leq 1.96\) 反解，得：

\[\bar{X} - z_{0.975} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{0.975} \cdot \frac{\sigma_0}{\sqrt{n}} \]

代入数值计算：

边际误差：\(1.96 \times \frac{\sqrt{0.05}}{\sqrt{6}} \approx 1.96 \times 0.0913 \approx 0.179\)
下限：\(15.06 - 0.179 = 14.88\)
上限：\(15.06 + 0.179 = 15.24\)

因此，方差已知时，均值的95%置信区间为 \(\boldsymbol{[14.88, 15.24]}\)。

(2) 方差未知的置信区间推导

步骤1：构造枢轴量

方差未知时，用样本标准差 \(S\) 代替总体标准差 \(\sigma\)，构造枢轴量：

\[G(X,\mu) = \frac{\sqrt{n}(\bar{X}-\mu)}{S} \sim t(n-1) = t(5) \]

分布与 \(\mu、\sigma\) 无关，满足枢轴量要求。

步骤2：计算样本标准差与分位数

计算样本离均差平方和：
\[\sum_{i=1}^6 (X_i - \bar{X})^2 = (14.70-15.06)^2 + \dots + (15.32-15.06)^2 = 0.3354 \]
样本方差：\(S^2 = \frac{1}{n-1}\sum (X_i-\bar{X})^2 = \frac{0.3354}{5} = 0.06708\)，样本标准差 \(S = \sqrt{0.06708} \approx 0.259\)
置信水平0.95，自由度5，t分布的0.975分位数 \(t_{0.975}(5)=2.5706\)，满足 \(P(-2.5706 \leq G \leq 2.5706)=0.95\)。

步骤3：反解不等式

对 \(-2.5706 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{0.259} \leq 2.5706\) 反解，得：

\[\bar{X} - t_{0.975}(5) \cdot \frac{S}{\sqrt{n}} \leq \mu \leq \bar{X} + t_{0.975}(5) \cdot \frac{S}{\sqrt{n}} \]

代入数值计算：

边际误差：\(2.5706 \times \frac{0.259}{\sqrt{6}} \approx 2.5706 \times 0.1057 \approx 0.2717\)
下限：\(15.06 - 0.2717 = 14.76\)
上限：\(15.06 + 0.2717 = 15.36\)

因此，方差未知时，均值的95%置信区间为 \(\boldsymbol{[14.76, 15.36]}\)。

例7.1.8 定数截尾指数分布的置信区间

题目

某电子元件寿命服从 \(\Gamma(1/\theta,1)\)（指数分布，均值为 \(\theta\)），10个独立样本中，仅观测到前6个失效的寿命（单位：h）：896, 950, 1005, 1100, 1150, 1220。
(1) 求这批元件平均寿命的95%置信下限；
(2) 设 \(p=P\{X_1>1100\}\)，求 \(p\) 的95%置信区间。

前置核心性质（定数截尾指数分布）

\(n\) 个样本，定数截尾（观测到前 \(r\) 个失效），总试验时间为：

\[T_{n,r} = \sum_{i=1}^r X_{(i)} + (n-r)X_{(r)} \]

其中 \(X_{(1)}\leq X_{(2)}\leq \dots \leq X_{(r)}\) 为前 \(r\) 个次序统计量。对于指数分布，有 \(2T_{n,r}/\theta \sim \chi^2(2r)\)，与完全样本的枢轴量仅自由度不同。

(1) 平均寿命的95%置信下限推导

步骤1：计算总试验时间

\(n=10, r=6\)，前6个失效时间为896,950,1005,1100,1150,1220，因此：

\[\sum_{i=1}^6 X_{(i)} = 896+950+1005+1100+1150+1220 = 6321 \]

\[(n-r)X_{(r)} = (10-6)\times1220 = 4880 \]

\[T_{n,r} = 6321 + 4880 = 11201, \quad 2T_{n,r}=22402 \]

步骤2：构造枢轴量与确定分位数

枢轴量 \(G(X,\theta) = \frac{2T_{n,r}}{\theta} \sim \chi^2(2r) = \chi^2(12)\)，分布与 \(\theta\) 无关。
置信水平0.95，\(\alpha=0.05\)，查卡方分布表得 \(\chi^2_{0.95}(12)=21.026\)，满足 \(P(G \leq 21.026)=0.95\)。

步骤3：反解不等式求置信下限

由 \(P\left( \frac{2T_{n,r}}{\theta} \leq 21.026 \right) = 0.95\)，反解得：

\[\theta \geq \frac{2T_{n,r}}{21.026} = \frac{22402}{21.026} \approx 1065.44 \]

因此，这批元件平均寿命的95%置信下限为 \(\boldsymbol{1065.44\ \text{h}}\)。

(2) 可靠度 \(p=P\{X_1>1100\}\) 的置信区间推导

步骤1：建立 \(p\) 与 \(\theta\) 的函数关系

指数分布的可靠度公式：

\[p = P\{X_1>1100\} = \int_{1100}^{+\infty} \frac{1}{\theta}e^{-x/\theta}dx = e^{-1100/\theta} \]

记 \(g(\theta)=e^{-1100/\theta}\)，求导得 \(g'(\theta) = \frac{1100}{\theta^2}e^{-1100/\theta} > 0\)，因此 \(g(\theta)\) 是 \(\theta\) 的严格单调递增函数，满足引理7.1.1的条件。

步骤2：求 \(\theta\) 的95%双侧置信区间

用枢轴量 \(G=2T_{n,r}/\theta \sim \chi^2(12)\)，取等尾分位数：

\(\chi^2_{0.025}(12)=4.404\)，\(\chi^2_{0.975}(12)=23.337\)
满足 \(P(4.404 \leq G \leq 23.337)=0.95\)

反解不等式得 \(\theta\) 的95%置信区间：

\[\frac{2T_{n,r}}{23.337} \leq \theta \leq \frac{2T_{n,r}}{4.404} \]

代入 \(2T_{n,r}=22402\)，计算得：

\[\underline{\theta} = \frac{22402}{23.337} \approx 959.93, \quad \overline{\theta} = \frac{22402}{4.404} \approx 5086.74 \]

即 \(\theta\) 的95%置信区间为 \([959.93, 5086.74]\)。

步骤3：变换得到 \(p\) 的置信区间

根据引理7.1.1，严格单调递增函数的置信区间为 \([g(\underline{\theta}), g(\overline{\theta})]\)，代入计算：

下限：\(g(\underline{\theta}) = e^{-1100/\overline{\theta}} = e^{-1100/5086.74} \approx e^{-0.216} \approx 0.81\)
上限：\(g(\overline{\theta}) = e^{-1100/\underline{\theta}} = e^{-1100/959.93} \approx e^{-1.146} \approx 0.32\)

因此，\(p\) 的95%置信区间为 \(\boldsymbol{[0.32, 0.81]}\)。

四、枢轴量法的常见误区澄清

误区1：把枢轴量当成统计量
纠正：统计量不含任何未知参数，枢轴量必须包含未知参数\(\theta\)，仅分布与\(\theta\)无关，二者本质不同。
误区2：构造的枢轴量分布与\(\theta\)有关
纠正：若枢轴量的分布依赖\(\theta\)，则分位数\(a,b\)会随\(\theta\)变化，无法反解得到固定的置信区间，这是构造枢轴量的核心禁忌。
误区3：反解不等式时忽略不等号方向
纠正：若\(G\)关于\(\theta\)严格递减，反解时必须反转不等号，否则会得到完全错误的区间，甚至出现置信下限大于置信上限的情况。
误区4：认为“置信区间包含真值的概率是\(1-\alpha\)”
纠正：真值是固定常数，区间是随机的。正确表述为：重复抽样构造100个\(1-\alpha\)置信区间，约\(100(1-\alpha)\)个区间会包含真实参数，单个区间要么包含真值，要么不包含，无概率属性。

五、全知识点结构化归纳总结

表1 枢轴量法三大核心步骤总结

步骤	核心动作	关键要求	注意事项
1. 构造枢轴量	从参数的优良点估计出发，构造\(G(X,\theta)\)	① 包含未知参数\(\theta\)；② 分布完全已知且与\(\theta\)无关；③ 关于\(\theta\)严格单调	优先基于充分统计量构造，保证区间最优性
2. 确定分位数	找到\(a,b\)满足\(P(a≤G≤b)=1-\alpha\)	对称分布选等尾分位数；非对称分布可选择等尾或最短区间分位数	单侧置信限仅需取单边分位数
3. 不等式反解	将\(a≤G≤b\)等价变形为\(\underline{\theta}≤\theta≤\overline{\theta}\)	严格保证不等式等价，不改变事件概率	\(G\)关于\(\theta\)递减时，反解必须反转不等号

表2 常见分布的枢轴量与置信区间汇总

总体分布	待估参数	枢轴量	枢轴量分布	置信水平\(1-\alpha\)的置信区间/限
正态\(N(\mu,\sigma^2)\)（\(\sigma\)已知）	均值\(\mu\)	\(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0}\)	\(N(0,1)\)	双侧：\(\left[ \bar{X} \pm z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \right]\) 单侧下限：\(\bar{X} - z_{1-\alpha} \cdot \frac{\sigma_0}{\sqrt{n}}\)
正态\(N(\mu,\sigma^2)\)（\(\sigma\)未知）	均值\(\mu\)	\(\frac{\sqrt{n}(\bar{X}-\mu)}{S}\)	\(t(n-1)\)	双侧：\(\left[ \bar{X} \pm t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \right]\)
指数分布\(\Gamma(1/\theta,1)\)	失效率\(\theta\)	\(\frac{2\sum X_i}{\theta}\)	\(\chi^2(2n)\)	单侧下限：\(\frac{2\sum X_i}{\chi^2_{1-\alpha}(2n)}\)
均匀分布\(R(0,\theta)\)	上限\(\theta\)	\(\frac{X_{(n)}}{\theta}\)	\(BE(n,1)\)	最短双侧：\(\left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right]\)
双参数指数分布	尺度参数\(\sigma\)	\(\frac{2\sum (X_i-X_{(1)})}{\sigma}\)	\(\chi^2(2n-2)\)	双侧：\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\)
多元正态\(N(\mu,I_n)\)	均值向量\(\mu\)	\(\|\|Y-\mu\|\|^2\)	\(\chi^2(n)\)	置信域：\(\{ \mu: \|\|\mu-Y\|\|^2 ≤ \chi^2_{1-\alpha}(n) \}\)

表3 枢轴量与统计量的核心区别

对比维度	统计量	枢轴量
未知参数	完全不含未知参数	必须包含待估的未知参数\(\theta\)
分布特性	分布通常依赖未知参数\(\theta\)	分布完全已知，且与未知参数\(\theta\)无关
核心用途	用于参数的点估计、假设检验统计量构造	专门用于构造参数的置信区间/置信域
示例	样本均值\(\bar{X}\)、样本方差\(S^2\)	\(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\)、\(\frac{2\sum X_i}{\theta}\)

posted on 2026-02-27 18:48 Indian_Mysore 阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

昆仑山:眼中无形心中有穴之穴人合一

7.1.2枢轴量法构造置信区间

枢轴量法构造置信区间 深度讲解与完整推导

一、构造置信区间的方法概述

二、枢轴量法的核心原理与通用步骤

2.1 核心概念辨析：枢轴量 vs 统计量

2.2 枢轴量法的三大通用步骤（每步含逻辑与注意事项）

步骤1：构造合适的枢轴量\(G(X,\theta)\)

步骤2：确定分位数\(a,b\)，满足覆盖概率要求

步骤3：不等式等价反解，得到置信区间

三、核心例题的完整推导与讲解

例7.1.1 正态总体\(N(\mu,\sigma^2)\)均值\(\mu\)的置信区间

情况1：总体方差\(\sigma=\sigma_0\)已知

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：不等式反解

情况2：总体方差\(\sigma^2\)未知

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：不等式反解

例7.1.2 Gamma分布\(\Gamma(1/\theta,1)\)参数\(\theta\)的置信下限

步骤1：构造枢轴量

步骤2：确定单边分位数

步骤3：不等式反解

例7.1.3 均匀分布\(R(0,\theta)\)参数\(\theta\)的置信区间

步骤1：构造枢轴量

步骤2：确定分位数\(a,b\)

步骤3：不等式反解

最优最短区间推导

例7.1.4-例7.1.8题核心结论与推导逻辑

例7.1.4 - 例7.1.8 完整详细推导过程

例7.1.4 双参数指数分布的置信区间与联合置信域

题目

前置核心性质（双参数指数分布）

一、参数 \(\sigma\) 的置信区间推导

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：不等式等价反解

二、参数 \(\mu\) 的置信区间推导

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：不等式等价反解

三、\(\mu\) 与 \(\sigma\) 的联合置信域

例7.1.5 多元正态分布均值向量的置信域

题目

完整推导

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：不等式反解得到置信域

例7.1.6 指数分布寿命数据的置信下限（数值应用）

题目

完整推导

步骤1：确定分布与枢轴量

步骤2：计算样本统计量与分位数

步骤3：反解不等式求置信下限

例7.1.7 正态总体均值的置信区间（数值应用）

题目

前置计算

(1) 方差已知 \(\sigma^2=0.05\) 的置信区间推导

步骤1：构造枢轴量

步骤2：确定分位数

步骤3：反解不等式

(2) 方差未知的置信区间推导

步骤1：构造枢轴量

步骤2：计算样本标准差与分位数

步骤3：反解不等式

例7.1.8 定数截尾指数分布的置信区间

题目

前置核心性质（定数截尾指数分布）

(1) 平均寿命的95%置信下限推导

步骤1：计算总试验时间

步骤2：构造枢轴量与确定分位数

步骤3：反解不等式求置信下限

(2) 可靠度 \(p=P\{X_1>1100\}\) 的置信区间推导

步骤1：建立 \(p\) 与 \(\theta\) 的函数关系

步骤2：求 \(\theta\) 的95%双侧置信区间

步骤3：变换得到 \(p\) 的置信区间

四、枢轴量法的常见误区澄清

五、全知识点结构化归纳总结

表1 枢轴量法三大核心步骤总结

枢轴量法构造置信区间深度讲解与完整推导