7.1.2枢轴量法构造置信区间
枢轴量法构造置信区间 深度讲解与完整推导
作为深耕数理统计领域多年的研究员,我将从核心原理、步骤拆解、逐例严谨推导、误区澄清、结构化总结五个维度,完整讲解构造置信区间的核心方法——枢轴量法,确保每一步逻辑清晰、推导无跳步,彻底解决初学者的理解难点。
一、构造置信区间的方法概述
置信区间的核心是找到满足覆盖概率要求的随机区间,主流构造方法分为三类:
- 精确枢轴量法:从参数的优良点估计出发构造枢轴量,得到精确满足覆盖概率的置信区间,适用于总体分布已知的小样本场景,是本节的核心。
- 大样本近似枢轴量法:利用中心极限定理构造渐近分布已知的枢轴量,得到近似置信区间,适用于总体分布未知、样本量充足的场景。
- 假设检验接受域反推法:利用区间估计与假设检验的对偶性,通过检验的接受域反解得到置信区间/域,后续章节会详细讲解。
二、枢轴量法的核心原理与通用步骤
2.1 核心概念辨析:枢轴量 vs 统计量
这是90%初学者的核心混淆点,必须先明确区分:
| 概念 | 定义要求 | 核心区别 |
|---|---|---|
| 统计量 | 完全由样本决定,不能包含任何未知参数 | 仅提取样本信息,不含未知参数,用于点估计 |
| 枢轴量 | 必须同时满足两个条件: ① 是样本\(X\)和未知参数\(\theta\)的函数(必须包含\(\theta\)); ② 概率分布完全已知,且与未知参数\(\theta\)无关 |
包含未知参数,但分布与参数无关,是连接样本与未知参数的“桥梁” |
核心逻辑:只有枢轴量的分布与\(\theta\)无关,我们才能找到固定的、不依赖于\(\theta\)的分位数,进而通过不等式反解得到置信区间。
2.2 枢轴量法的三大通用步骤(每步含逻辑与注意事项)
步骤1:构造合适的枢轴量\(G(X,\theta)\)
- 核心动作:从\(\theta\)的优良点估计(优先选充分统计量、极大似然估计、无偏估计)出发,构造包含\(\theta\)和估计量的函数,使其满足枢轴量的两个核心条件。
- 为什么从点估计出发? 充分统计量已经捕捉了样本中关于\(\theta\)的全部信息,基于它构造的置信区间是同置信水平下精度最高(平均长度最短)的区间。
- 关键要求:\(G(X,\theta)\)关于\(\theta\)必须是严格单调函数(严格递增/递减),这是后续不等式等价反解的前提,确保变形不改变事件的概率。
步骤2:确定分位数\(a,b\),满足覆盖概率要求
- 核心动作:根据\(G(X,\theta)\)的已知分布,找到常数\(a,b\),使得:\[P_\theta\left\{a \leq G(X,\theta) \leq b\right\} = 1-\alpha, \quad \forall \theta \in \Theta \]其中\(1-\alpha\)为预先设定的置信水平。
- 分位数选择原则:
- 对称分布(正态、t分布):选等尾分位数(\(a=\)分布的\(\alpha/2\)分位数,\(b=\)分布的\(1-\alpha/2\)分位数),此时区间长度最短,也是最常用的选择。
- 非对称分布(卡方、F、Gamma分布):等尾分位数是最易计算的常用选择;若需最优区间,需在约束\(P(G<a)+P(G>b)=\alpha\)下求解最短区间。
- 单侧置信限:仅需取单边分位数,如求置信下限取\(P(G \leq b)=1-\alpha\),求置信上限取\(P(G \geq a)=1-\alpha\)。
步骤3:不等式等价反解,得到置信区间
- 核心动作:将\(a \leq G(X,\theta) \leq b\)等价变形为关于\(\theta\)的不等式\(\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\),此时有:\[P_\theta\left\{\underline{\theta}(X) \leq \theta \leq \overline{\theta}(X)\right\} = 1-\alpha \]\([\underline{\theta}(X), \overline{\theta}(X)]\)即为\(\theta\)的置信水平为\(1-\alpha\)的置信区间。
- 关键注意事项:
- 若\(G\)关于\(\theta\)严格递增:反解后不等号方向不变;
- 若\(G\)关于\(\theta\)严格递减:反解后不等号方向必须反转,这是初学者最易出错的点。
三、核心例题的完整推导与讲解
例7.1.1 正态总体\(N(\mu,\sigma^2)\)均值\(\mu\)的置信区间
题目:设\(X_1,X_2,\dots,X_n\)是来自\(N(\mu,\sigma^2)\)的独立同分布样本,求\(\mu\)的置信水平为\(1-\alpha\)的置信区间。
情况1:总体方差\(\sigma=\sigma_0\)已知
步骤1:构造枢轴量
\(\mu\)的优良点估计是样本均值\(\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\),由正态分布性质:\(\bar{X} \sim N\left(\mu, \frac{\sigma_0^2}{n}\right)\),标准化后得到:
- 验证:包含未知参数\(\mu\),分布为标准正态\(N(0,1)\),完全已知且与\(\mu\)无关,是枢轴量;且\(G\)关于\(\mu\)严格递减。
步骤2:确定分位数
标准正态是对称分布,取等尾分位数\(z_{\alpha/2}=-z_{1-\alpha/2}\),满足:
步骤3:不等式反解
对不等式三边做等价变形:
- 乘以\(\sigma_0/\sqrt{n}\)(正数,不等号方向不变):\[-z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \bar{X}-\mu \leq z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]
- 减去\(\bar{X}\),再乘以-1(不等号反转):\[\bar{X} - z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \]
因此,\(\sigma\)已知时,\(\mu\)的\(1-\alpha\)双侧置信区间为:
情况2:总体方差\(\sigma^2\)未知
\(\sigma\)未知时,上述枢轴量包含未知参数\(\sigma\),不再是枢轴量,因此用样本标准差\(S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2}\)代替\(\sigma\),构造新的枢轴量。
步骤1:构造枢轴量
由正态分布的核心性质:
- \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma} \sim N(0,1)\);
- \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)(自由度为\(n-1\)的卡方分布);
- \(\bar{X}\)与\(S^2\)相互独立。
根据t分布的定义\(T=\frac{Z}{\sqrt{W/k}} \sim t(k)\)(\(Z\sim N(0,1)\),\(W\sim\chi^2(k)\),独立),代入得:
- 验证:包含未知参数\(\mu\),分布为自由度\(n-1\)的t分布,完全已知且与\(\mu、\sigma\)无关,是枢轴量;\(G\)关于\(\mu\)严格递减。
步骤2:确定分位数
t分布是对称分布,取等尾分位数\(t_{1-\alpha/2}(n-1)\),满足:
步骤3:不等式反解
与\(\sigma\)已知的情况完全类似,反解得:
因此,\(\sigma\)未知时,\(\mu\)的\(1-\alpha\)双侧置信区间为:
例7.1.2 Gamma分布\(\Gamma(1/\theta,1)\)参数\(\theta\)的置信下限
题目:设\(X_1,X_2,\dots,X_n\)是来自\(\Gamma(1/\theta,1)\)(尺度参数化Gamma分布,平均寿命为\(1/\theta\))的独立同分布样本,求\(\theta\)的置信水平为\(1-\alpha\)的置信下限。
步骤1:构造枢轴量
\(\theta\)的充分统计量为\(T(X)=\sum_{i=1}^n X_i\),由Gamma分布可加性:\(T(X) \sim \Gamma(1/\theta, n)\)。利用Gamma分布与卡方分布的关系,构造:
- 验证:包含未知参数\(\theta\),分布为自由度\(2n\)的卡方分布,完全已知且与\(\theta\)无关,是枢轴量;\(G\)关于\(\theta\)严格递减。
步骤2:确定单边分位数
求置信下限需满足\(P(\theta \geq \underline{\theta}(X))=1-\alpha\),因此取单边分位数:
其中\(\chi^2_p(k)\)为自由度\(k\)的卡方分布\(p\)分位数。
步骤3:不等式反解
对不等式\(\frac{2T(X)}{\theta} < \chi^2_{1-\alpha}(2n)\)做等价变形:
- 两边乘以\(\theta\)(正数,不等号不变):\(2T(X) < \chi^2_{1-\alpha}(2n) \cdot \theta\)
- 两边除以\(\chi^2_{1-\alpha}(2n)\):\(\theta > \frac{2T(X)}{\chi^2_{1-\alpha}(2n)}\)
因此,\(\theta\)的\(1-\alpha\)置信下限为:
例7.1.3 均匀分布\(R(0,\theta)\)参数\(\theta\)的置信区间
题目:设\(X_1,X_2,\dots,X_n\)是来自均匀分布\(R(0,\theta)\)的独立同分布样本,求\(\theta\)的置信水平为\(1-\alpha\)的置信区间。
步骤1:构造枢轴量
\(\theta\)的充分完备统计量是次序统计量\(X_{(n)} = \max\{X_1,\dots,X_n\}\),其分布函数为\(F_{X_{(n)}}(x) = (x/\theta)^n, 0<x<\theta\)。构造:
求G的分布:\(F_G(g) = P(X_{(n)}/\theta \leq g) = g^n, 0<g<1\),即\(G \sim BE(n,1)\)(Beta分布),完全已知且与\(\theta\)无关,是枢轴量;\(G\)关于\(\theta\)严格递减。
步骤2:确定分位数\(a,b\)
需找到\(0<a<b≤1\),满足:
步骤3:不等式反解
对\(a \leq X_{(n)}/\theta \leq b\)等价变形:
因此,\(\theta\)的\(1-\alpha\)置信区间为\(\left[ \frac{X_{(n)}}{b}, \frac{X_{(n)}}{a} \right]\),其中\(b^n -a^n=1-\alpha\)。
最优最短区间推导
区间长度\(L = X_{(n)}(1/a - 1/b)\),需在\(b^n -a^n=1-\alpha\)约束下最小化\(L\)。通过单调性分析可证:\(1/a -1/b\)是\(b\)的严格递减函数,因此\(b=1\)时\(L\)最小,此时\(a=\sqrt[n]{\alpha}\)。
因此,\(\theta\)的最短\(1-\alpha\)置信区间为:
例7.1.4-例7.1.8题核心结论与推导逻辑
| 例题编号 | 分布场景 | 核心枢轴量 | 核心结论 |
|---|---|---|---|
| 例7.1.4 | 双参数指数分布\(X\sim\mu+\Gamma(1/\sigma,1)\) | 1. \(G_1=2S(X)/\sigma \sim \chi^2(2n-2)\) 2. \(G_2=\frac{n(n-1)(X_{(1)}-\mu)}{S(X)} \sim F(2,2n-2)\) |
\(\sigma\)的\(1-\alpha\)置信区间:\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\) \(\mu\)的\(1-\alpha\)置信区间:\(\left[ X_{(1)} - \frac{F_{1-\alpha/2}S}{n(n-1)}, X_{(1)} - \frac{F_{\alpha/2}S}{n(n-1)} \right]\) |
| 例7.1.5 | 多元正态分布\(Y\sim N(\mu,I_n)\) | \(G(Y,\mu)=||Y-\mu||^2 \sim \chi^2(n)\) | \(\mu\)的\(1-\alpha\)置信域:以\(Y\)为中心、\(\sqrt{\chi^2_{1-\alpha}(n)}\)为半径的\(n\)维球 |
| 例7.1.6 | 指数分布寿命数据(例7.1.2的数值应用) | 同例7.1.2 | 代入\(n=9,T=5320,\chi^2_{0.95}(18)=28.869\),得平均寿命置信下限368.6h |
| 例7.1.7 | 正态分布滚珠直径数据(例7.1.1的数值应用) | 同例7.1.1 | 方差已知时95%置信区间\([14.88,15.24]\);方差未知时\([14.76,15.36]\) |
| 例7.1.8 | 定数截尾指数分布寿命数据 | \(G=2T_{n,r}/\theta \sim \chi^2(2r)\) | 平均寿命置信下限1065.44h;可靠度\(p=P(X>1100)\)的95%置信区间\([0.32,0.81]\) |
例7.1.4 - 例7.1.8 完整详细推导过程
以下推导严格遵循枢轴量法三大核心步骤,每一步均明确分布依据、公式来源与变形逻辑,无任何跳步,确保初学者可完整复现。
例7.1.4 双参数指数分布的置信区间与联合置信域
题目
设 \(X_1,X_2,\dots,X_n\) 为独立同分布样本,且 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\)(位置-尺度双参数指数分布,即 \(X-\mu \sim \text{Exp}(1/\sigma)\),均值为 \(\sigma\)),求参数 \(\sigma\) 和 \(\mu\) 的水平为 \(1-\alpha\) 的置信区间,以及二者的联合置信域。
前置核心性质(双参数指数分布)
- 分布密度:\(f(x;\mu,\sigma) = \frac{1}{\sigma}e^{-(x-\mu)/\sigma}, \ x\geq\mu, \ \sigma>0\)
- 充分统计量:由因子分解定理,充分完备统计量为 \(T=(X_{(1)}, S(X))\),其中:
- \(X_{(1)} = \min\{X_1,X_2,\dots,X_n\}\)(最小次序统计量)
- \(S(X) = \sum_{i=1}^n (X_i - X_{(1)})\)(样本离均差和)
- 分布与独立性:
- \(X_{(1)} \sim \mu + \Gamma(n/\sigma, 1)\),即 \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\)
- \(S(X) \sim \Gamma(1/\sigma, n-1)\)(Gamma分布,形状参数 \(n-1\),率参数 \(1/\sigma\))
- \(X_{(1)}\) 与 \(S(X)\) 相互独立
一、参数 \(\sigma\) 的置信区间推导
步骤1:构造枢轴量
基于 \(S(X)\) 的分布,构造函数:
枢轴量验证:
- 包含未知参数 \(\sigma\);
- 分布推导:若 \(Y \sim \Gamma(\lambda, k)\)(率参数 \(\lambda\),形状参数 \(k\)),则 \(2\lambda Y \sim \chi^2(2k)\)。此处 \(S(X) \sim \Gamma(1/\sigma, n-1)\),代入得 \(2\cdot(1/\sigma)\cdot S(X) \sim \chi^2(2(n-1))\),即 \(G_1 \sim \chi^2(2n-2)\),分布完全已知,与 \(\sigma、\mu\) 均无关;
- \(G_1\) 关于 \(\sigma\) 严格单调递减,满足反解要求。
步骤2:确定分位数
卡方分布为非对称分布,取等尾分位数,记 \(\chi^2_p(k)\) 为自由度 \(k\) 的卡方分布的下 \(p\) 分位数(满足 \(P(\chi^2(k) \leq \chi^2_p(k))=p\)),则:
原理:\(P(G_1 \leq \chi^2_{1-\alpha/2}) - P(G_1 \leq \chi^2_{\alpha/2}) = (1-\alpha/2) - \alpha/2 = 1-\alpha\)。
步骤3:不等式等价反解
对不等式 \(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2}\) 做等价变形(所有项均为正数,乘除不改变不等号方向):
- 左侧不等式:\(\chi^2_{\alpha/2} \leq \frac{2S}{\sigma} \implies \sigma \leq \frac{2S}{\chi^2_{\alpha/2}(2n-2)}\)
- 右侧不等式:\(\frac{2S}{\sigma} \leq \chi^2_{1-\alpha/2} \implies \sigma \geq \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}\)
合并得:
因此,\(\sigma\) 的水平为 \(1-\alpha\) 的置信区间为:
二、参数 \(\mu\) 的置信区间推导
步骤1:构造枢轴量
基于 \(X_{(1)}\) 的分布,结合F分布的定义构造枢轴量。
- 由 \(X_{(1)} - \mu \sim \text{Exp}(n/\sigma)\),得 \(\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\)(指数分布与卡方分布的关系:\(\text{Exp}(\lambda) \sim \Gamma(1,\lambda)\),故 \(2\lambda Y \sim \chi^2(2)\));
- 已知 \(\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\),且与 \(\frac{2n(X_{(1)} - \mu)}{\sigma}\) 独立;
- F分布定义:若 \(U \sim \chi^2(k_1), V \sim \chi^2(k_2)\) 且独立,则 \(F = \frac{U/k_1}{V/k_2} \sim F(k_1,k_2)\)。
代入 \(U=\frac{2n(X_{(1)} - \mu)}{\sigma} \sim \chi^2(2)\),\(V=\frac{2S(X)}{\sigma} \sim \chi^2(2n-2)\),\(k_1=2, k_2=2n-2\),化简得:
枢轴量验证:
- 包含未知参数 \(\mu\),\(\sigma\) 已完全约去;
- 分布为 \(F(2, 2n-2)\),完全已知,与 \(\mu、\sigma\) 无关;
- \(G_2\) 关于 \(\mu\) 严格单调递减,满足反解要求。
步骤2:确定分位数
F分布为非对称分布,取等尾分位数,记 \(F_p(k_1,k_2)\) 为自由度 \(k_1,k_2\) 的F分布的下 \(p\) 分位数,则:
步骤3:不等式等价反解
对不等式 \(F_{\alpha/2} \leq \frac{n(n-1)(X_{(1)} - \mu)}{S} \leq F_{1-\alpha/2}\) 做等价变形(\(n,S\) 均为正数,乘除不改变不等号方向):
- 两边乘 \(S\),除以 \(n(n-1)\):\[\frac{F_{\alpha/2} \cdot S}{n(n-1)} \leq X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} \cdot S}{n(n-1)} \]
- 解左侧不等式:\(\frac{F_{\alpha/2} S}{n(n-1)} \leq X_{(1)} - \mu \implies \mu \leq X_{(1)} - \frac{F_{\alpha/2} S}{n(n-1)}\)
- 解右侧不等式:\(X_{(1)} - \mu \leq \frac{F_{1-\alpha/2} S}{n(n-1)} \implies \mu \geq X_{(1)} - \frac{F_{1-\alpha/2} S}{n(n-1)}\)(乘-1反转不等号)
合并得:
因此,\(\mu\) 的水平为 \(1-\alpha\) 的置信区间为:
三、\(\mu\) 与 \(\sigma\) 的联合置信域
根据引理7.1.2(置信域交运算性质):若 \(S_1,S_2\) 分别为参数 \(\theta_1,\theta_2\) 的水平 \(1-\alpha_1,1-\alpha_2\) 的置信域,则 \(S_1 \cap S_2\) 为 \((\theta_1,\theta_2)\) 的水平 \(1-\alpha_1-\alpha_2\) 的置信域。
为得到水平 \(1-\alpha\) 的联合置信域,取 \(\alpha_1=\alpha_2=\alpha/2\),即:
- \(\sigma\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\sigma(\alpha/2)\)
- \(\mu\) 取水平 \(1-\alpha/2\) 的置信区间 \(C_\mu(\alpha/2)\)
则二者的笛卡尔积(交集)即为 \((\mu,\sigma)\) 的水平为 \(1-\alpha\) 的联合置信域:
例7.1.5 多元正态分布均值向量的置信域
题目
\(Y=(Y_1,Y_2,\dots,Y_n)^T\) 服从多元正态分布 \(N(\mu, I_n)\),其中 \(I_n\) 为 \(n\) 阶单位矩阵,求参数 \(\mu\) 的水平为 \(1-\alpha\) 的置信域。
完整推导
步骤1:构造枢轴量
多元正态分布核心性质:若 \(Y \sim N(\mu, \Sigma)\),则 \(Y-\mu \sim N(0, \Sigma)\)。本题中 \(\Sigma=I_n\),因此:
即 \(Y-\mu\) 的每个分量 \(Y_i - \mu_i \sim N(0,1)\),且相互独立。
卡方分布定义:独立标准正态变量的平方和服从卡方分布,即若 \(Z_1,\dots,Z_n \overset{i.i.d.}{\sim} N(0,1)\),则 \(\sum_{i=1}^n Z_i^2 \sim \chi^2(n)\)。
因此构造枢轴量:
枢轴量验证:
- 包含未知参数向量 \(\mu\);
- 分布为 \(\chi^2(n)\),完全已知,与 \(\mu\) 无关,满足枢轴量要求。
步骤2:确定分位数
取卡方分布的下 \(1-\alpha\) 分位数 \(\chi^2_{1-\alpha}(n)\),满足:
步骤3:不等式反解得到置信域
不等式 \(\|Y - \mu\|^2 \leq \chi^2_{1-\alpha}(n)\) 直接定义了 \(\mu\) 的取值范围,因此 \(\mu\) 的水平为 \(1-\alpha\) 的置信域为:
几何意义:该置信域是 \(n\) 维空间中,以观测向量 \(Y\) 为中心、以 \(\sqrt{\chi^2_{1-\alpha}(n)}\) 为半径的 \(n\) 维球体。
例7.1.6 指数分布寿命数据的置信下限(数值应用)
题目
某厂生产的产品寿命服从分布 \(\Gamma(1/\theta,1)\)(指数分布,均值为 \(\theta\)),观测到9个产品的寿命(单位:h):150, 450, 500, 530, 600, 650, 700, 830, 910,求其平均寿命的置信下限(置信水平0.95)。
完整推导
步骤1:确定分布与枢轴量
产品寿命 \(X \sim \text{Exp}(1/\theta)\),均值 \(E(X)=\theta\),样本 \(X_1,\dots,X_9\) 独立同分布。
由Gamma分布可加性,充分统计量 \(T(X) = \sum_{i=1}^9 X_i \sim \Gamma(1/\theta, 9)\),构造枢轴量:
分布与 \(\theta\) 无关,满足枢轴量要求。
步骤2:计算样本统计量与分位数
- 计算总寿命:\(T(X) = 150+450+500+530+600+650+700+830+910 = 5320\)
- 置信水平 \(1-\alpha=0.95\),\(\alpha=0.05\),查卡方分布表得 \(\chi^2_{0.95}(18)=28.869\),满足 \(P(G \leq 28.869)=0.95\)。
步骤3:反解不等式求置信下限
由 \(P\left( \frac{2T(X)}{\theta} \leq 28.869 \right) = 0.95\),反解不等式:
因此,这批产品平均寿命的95%置信下限为 \(\boldsymbol{368.6\ \text{h}}\)。
例7.1.7 正态总体均值的置信区间(数值应用)
题目
某厂生产的滚珠直径服从正态分布,抽取6个样本,测得直径(单位:mm):14.70, 15.21, 14.90, 14.91, 15.32, 15.32。试估计直径平均值,并按以下两种情况求均值的95%置信区间:
(1) 方差已知为0.05;(2) 方差未知。
前置计算
样本量 \(n=6\),先计算样本均值:
(1) 方差已知 \(\sigma^2=0.05\) 的置信区间推导
步骤1:构造枢轴量
滚珠直径 \(X \sim N(\mu, 0.05)\),样本均值 \(\bar{X} \sim N\left( \mu, \frac{0.05}{6} \right)\),标准化得枢轴量:
分布与 \(\mu\) 无关,满足枢轴量要求。
步骤2:确定分位数
置信水平0.95,\(\alpha=0.05\),标准正态分布的0.975分位数 \(z_{0.975}=1.96\),满足:
步骤3:反解不等式
对 \(-1.96 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{\sqrt{0.05}} \leq 1.96\) 反解,得:
代入数值计算:
- 边际误差:\(1.96 \times \frac{\sqrt{0.05}}{\sqrt{6}} \approx 1.96 \times 0.0913 \approx 0.179\)
- 下限:\(15.06 - 0.179 = 14.88\)
- 上限:\(15.06 + 0.179 = 15.24\)
因此,方差已知时,均值的95%置信区间为 \(\boldsymbol{[14.88, 15.24]}\)。
(2) 方差未知的置信区间推导
步骤1:构造枢轴量
方差未知时,用样本标准差 \(S\) 代替总体标准差 \(\sigma\),构造枢轴量:
分布与 \(\mu、\sigma\) 无关,满足枢轴量要求。
步骤2:计算样本标准差与分位数
- 计算样本离均差平方和:\[\sum_{i=1}^6 (X_i - \bar{X})^2 = (14.70-15.06)^2 + \dots + (15.32-15.06)^2 = 0.3354 \]
- 样本方差:\(S^2 = \frac{1}{n-1}\sum (X_i-\bar{X})^2 = \frac{0.3354}{5} = 0.06708\),样本标准差 \(S = \sqrt{0.06708} \approx 0.259\)
- 置信水平0.95,自由度5,t分布的0.975分位数 \(t_{0.975}(5)=2.5706\),满足 \(P(-2.5706 \leq G \leq 2.5706)=0.95\)。
步骤3:反解不等式
对 \(-2.5706 \leq \frac{\sqrt{6}(\bar{X}-\mu)}{0.259} \leq 2.5706\) 反解,得:
代入数值计算:
- 边际误差:\(2.5706 \times \frac{0.259}{\sqrt{6}} \approx 2.5706 \times 0.1057 \approx 0.2717\)
- 下限:\(15.06 - 0.2717 = 14.76\)
- 上限:\(15.06 + 0.2717 = 15.36\)
因此,方差未知时,均值的95%置信区间为 \(\boldsymbol{[14.76, 15.36]}\)。
例7.1.8 定数截尾指数分布的置信区间
题目
某电子元件寿命服从 \(\Gamma(1/\theta,1)\)(指数分布,均值为 \(\theta\)),10个独立样本中,仅观测到前6个失效的寿命(单位:h):896, 950, 1005, 1100, 1150, 1220。
(1) 求这批元件平均寿命的95%置信下限;
(2) 设 \(p=P\{X_1>1100\}\),求 \(p\) 的95%置信区间。
前置核心性质(定数截尾指数分布)
\(n\) 个样本,定数截尾(观测到前 \(r\) 个失效),总试验时间为:
其中 \(X_{(1)}\leq X_{(2)}\leq \dots \leq X_{(r)}\) 为前 \(r\) 个次序统计量。对于指数分布,有 \(2T_{n,r}/\theta \sim \chi^2(2r)\),与完全样本的枢轴量仅自由度不同。
(1) 平均寿命的95%置信下限推导
步骤1:计算总试验时间
\(n=10, r=6\),前6个失效时间为896,950,1005,1100,1150,1220,因此:
步骤2:构造枢轴量与确定分位数
枢轴量 \(G(X,\theta) = \frac{2T_{n,r}}{\theta} \sim \chi^2(2r) = \chi^2(12)\),分布与 \(\theta\) 无关。
置信水平0.95,\(\alpha=0.05\),查卡方分布表得 \(\chi^2_{0.95}(12)=21.026\),满足 \(P(G \leq 21.026)=0.95\)。
步骤3:反解不等式求置信下限
由 \(P\left( \frac{2T_{n,r}}{\theta} \leq 21.026 \right) = 0.95\),反解得:
因此,这批元件平均寿命的95%置信下限为 \(\boldsymbol{1065.44\ \text{h}}\)。
(2) 可靠度 \(p=P\{X_1>1100\}\) 的置信区间推导
步骤1:建立 \(p\) 与 \(\theta\) 的函数关系
指数分布的可靠度公式:
记 \(g(\theta)=e^{-1100/\theta}\),求导得 \(g'(\theta) = \frac{1100}{\theta^2}e^{-1100/\theta} > 0\),因此 \(g(\theta)\) 是 \(\theta\) 的严格单调递增函数,满足引理7.1.1的条件。
步骤2:求 \(\theta\) 的95%双侧置信区间
用枢轴量 \(G=2T_{n,r}/\theta \sim \chi^2(12)\),取等尾分位数:
- \(\chi^2_{0.025}(12)=4.404\),\(\chi^2_{0.975}(12)=23.337\)
- 满足 \(P(4.404 \leq G \leq 23.337)=0.95\)
反解不等式得 \(\theta\) 的95%置信区间:
代入 \(2T_{n,r}=22402\),计算得:
即 \(\theta\) 的95%置信区间为 \([959.93, 5086.74]\)。
步骤3:变换得到 \(p\) 的置信区间
根据引理7.1.1,严格单调递增函数的置信区间为 \([g(\underline{\theta}), g(\overline{\theta})]\),代入计算:
- 下限:\(g(\underline{\theta}) = e^{-1100/\overline{\theta}} = e^{-1100/5086.74} \approx e^{-0.216} \approx 0.81\)
- 上限:\(g(\overline{\theta}) = e^{-1100/\underline{\theta}} = e^{-1100/959.93} \approx e^{-1.146} \approx 0.32\)
因此,\(p\) 的95%置信区间为 \(\boldsymbol{[0.32, 0.81]}\)。
四、枢轴量法的常见误区澄清
-
误区1:把枢轴量当成统计量
纠正:统计量不含任何未知参数,枢轴量必须包含未知参数\(\theta\),仅分布与\(\theta\)无关,二者本质不同。 -
误区2:构造的枢轴量分布与\(\theta\)有关
纠正:若枢轴量的分布依赖\(\theta\),则分位数\(a,b\)会随\(\theta\)变化,无法反解得到固定的置信区间,这是构造枢轴量的核心禁忌。 -
误区3:反解不等式时忽略不等号方向
纠正:若\(G\)关于\(\theta\)严格递减,反解时必须反转不等号,否则会得到完全错误的区间,甚至出现置信下限大于置信上限的情况。 -
误区4:认为“置信区间包含真值的概率是\(1-\alpha\)”
纠正:真值是固定常数,区间是随机的。正确表述为:重复抽样构造100个\(1-\alpha\)置信区间,约\(100(1-\alpha)\)个区间会包含真实参数,单个区间要么包含真值,要么不包含,无概率属性。
五、全知识点结构化归纳总结
表1 枢轴量法三大核心步骤总结
| 步骤 | 核心动作 | 关键要求 | 注意事项 |
|---|---|---|---|
| 1. 构造枢轴量 | 从参数的优良点估计出发,构造\(G(X,\theta)\) | ① 包含未知参数\(\theta\);② 分布完全已知且与\(\theta\)无关;③ 关于\(\theta\)严格单调 | 优先基于充分统计量构造,保证区间最优性 |
| 2. 确定分位数 | 找到\(a,b\)满足\(P(a≤G≤b)=1-\alpha\) | 对称分布选等尾分位数;非对称分布可选择等尾或最短区间分位数 | 单侧置信限仅需取单边分位数 |
| 3. 不等式反解 | 将\(a≤G≤b\)等价变形为\(\underline{\theta}≤\theta≤\overline{\theta}\) | 严格保证不等式等价,不改变事件概率 | \(G\)关于\(\theta\)递减时,反解必须反转不等号 |
表2 常见分布的枢轴量与置信区间汇总
| 总体分布 | 待估参数 | 枢轴量 | 枢轴量分布 | 置信水平\(1-\alpha\)的置信区间/限 |
|---|---|---|---|---|
| 正态\(N(\mu,\sigma^2)\)(\(\sigma\)已知) | 均值\(\mu\) | \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma_0}\) | \(N(0,1)\) | 双侧:\(\left[ \bar{X} \pm z_{1-\alpha/2} \cdot \frac{\sigma_0}{\sqrt{n}} \right]\) 单侧下限:\(\bar{X} - z_{1-\alpha} \cdot \frac{\sigma_0}{\sqrt{n}}\) |
| 正态\(N(\mu,\sigma^2)\)(\(\sigma\)未知) | 均值\(\mu\) | \(\frac{\sqrt{n}(\bar{X}-\mu)}{S}\) | \(t(n-1)\) | 双侧:\(\left[ \bar{X} \pm t_{1-\alpha/2}(n-1) \cdot \frac{S}{\sqrt{n}} \right]\) |
| 指数分布\(\Gamma(1/\theta,1)\) | 失效率\(\theta\) | \(\frac{2\sum X_i}{\theta}\) | \(\chi^2(2n)\) | 单侧下限:\(\frac{2\sum X_i}{\chi^2_{1-\alpha}(2n)}\) |
| 均匀分布\(R(0,\theta)\) | 上限\(\theta\) | \(\frac{X_{(n)}}{\theta}\) | \(BE(n,1)\) | 最短双侧:\(\left[ X_{(n)}, \frac{X_{(n)}}{\sqrt[n]{\alpha}} \right]\) |
| 双参数指数分布 | 尺度参数\(\sigma\) | \(\frac{2\sum (X_i-X_{(1)})}{\sigma}\) | \(\chi^2(2n-2)\) | 双侧:\(\left[ \frac{2S}{\chi^2_{1-\alpha/2}(2n-2)}, \frac{2S}{\chi^2_{\alpha/2}(2n-2)} \right]\) |
| 多元正态\(N(\mu,I_n)\) | 均值向量\(\mu\) | \(||Y-\mu||^2\) | \(\chi^2(n)\) | 置信域:\(\{ \mu: ||\mu-Y||^2 ≤ \chi^2_{1-\alpha}(n) \}\) |
表3 枢轴量与统计量的核心区别
| 对比维度 | 统计量 | 枢轴量 |
|---|---|---|
| 未知参数 | 完全不含未知参数 | 必须包含待估的未知参数\(\theta\) |
| 分布特性 | 分布通常依赖未知参数\(\theta\) | 分布完全已知,且与未知参数\(\theta\)无关 |
| 核心用途 | 用于参数的点估计、假设检验统计量构造 | 专门用于构造参数的置信区间/置信域 |
| 示例 | 样本均值\(\bar{X}\)、样本方差\(S^2\) | \(\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\)、\(\frac{2\sum X_i}{\theta}\) |
posted on 2026-02-27 18:48 Indian_Mysore 阅读(0) 评论(0) 收藏 举报
浙公网安备 33010602011771号