1.6.3指数分布的次序统计量
指数分布的次序统计量 深度系统讲解
各位同学,今天我们来拆解指数分布的次序统计量这个知识点。这个知识点是可靠性统计、生存分析、寿命数据建模的绝对核心——指数分布的无记忆性,赋予了它的次序统计量独一无二的性质,这是其他任何分布都不具备的。我们从底层定义、公式推导、定理证明到应用价值,一步一步拆透,不仅让你会算公式,更能理解它背后的统计思想与工程意义。
一、开篇:为什么要专门研究指数分布的次序统计量?
在正式推导之前,我们必须先搞懂这个知识点的核心定位:
- 指数分布的核心地位:指数分布是描述“无老化、无记忆”寿命的唯一连续型分布,电子元器件的寿命、设备的故障间隔时间、生物的生存时间,绝大多数都用指数分布建模,是可靠性工程与生存分析的“基础分布”。
- 次序统计量的工程意义:在寿命试验中,我们不可能等到所有样本都失效(时间成本极高),通常只观测前r个失效的样本(定数截尾试验),这些失效时间就是指数分布样本的前r个次序统计量。因此,指数分布的次序统计量,是截尾寿命试验统计推断的唯一数据基础。
- 独有的核心特性:指数分布的次序统计量,其间距具有独立性——这是指数分布无记忆性的直接体现,也是它和均匀分布、正态分布次序统计量最本质的区别。均匀分布的间距同分布但不独立,而指数分布的归一化间距独立同分布,这个性质直接决定了它在工程中的易用性。
二、基础铺垫:指数分布的定义与核心特性
首先我们明确教材中指数分布的参数形式,避免大家和其他参数定义混淆。
1. 位置-尺度型指数分布的定义
教材中给出的指数分布为带位置参数的双参数指数分布,记为 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\),其中:
- \(\mu\):位置参数,也叫“保证寿命”——产品在时间\(\mu\)之前绝对不会失效,只有超过\(\mu\)才会发生失效,因此样本取值一定满足 \(X \geqslant \mu\);
- \(\sigma\):尺度参数,也叫“特征寿命”,失效率 \(\lambda = 1/\sigma\) 为常数,这是指数分布无记忆性的核心;
- \(\Gamma(\alpha,\lambda)\):Gamma分布,当形状参数\(\alpha=1\)时,Gamma分布退化为指数分布,因此标准指数分布(\(\mu=0,\sigma=1\))就是 \(\Gamma(1,1)\)。
对应的概率密度函数(PDF)和分布函数(CDF)为:
其中 \(I\{\cdot\}\) 是指示函数,满足条件时取1,否则取0。
2. 核心特性:无记忆性
指数分布的所有性质,都源于它的无记忆性:对于任意 \(s,t>0\),有
翻译成工程语言就是:一个已经工作了\(s\)小时的产品,它再工作\(t\)小时的概率,和一个全新的产品工作\(t\)小时的概率完全相同——产品不会“老化”,过去的工作时间不影响未来的寿命。
我们后续推导的次序统计量间距的独立性,本质就是无记忆性的直接体现。
三、前r个次序统计量的联合密度推导
在寿命试验中,我们最常用的是定数截尾试验:投n个样本进行寿命试验,观测到前r个样本失效就停止试验,得到的观测数据就是前r个次序统计量 \(X_{(1)} < X_{(2)} < \dots < X_{(r)}\)(\(r \leqslant n\))。因此我们首先推导它的联合概率密度。
1. 回顾通用公式
上一节我们已经推导了任意连续型分布前r个次序统计量的联合密度通用公式:
这个公式的本质是:r个样本分别落在r个微小区间,剩下的\(n-r\)个样本全部大于\(y_r\),组合数为排列数 \(\frac{n!}{(n-r)!}\)。
2. 代入指数分布的f和F,逐步化简
我们记 \(Y_i = X_{(i)}\),将指数分布的\(f(y_i)\)和\(F(y_r)\)代入通用公式:
- 首先代入密度和生存函数(\(1-F(y_r)\) 也叫生存函数,记为\(S(y_r)=P(X>y_r)\)):\[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left[ \prod_{i=1}^r \frac{1}{\sigma} \mathrm{e}^{-\frac{y_i-\mu}{\sigma}} I\{y_i \geqslant \mu\} \right] \cdot \left( \mathrm{e}^{-\frac{y_r-\mu}{\sigma}} \right)^{n-r} \cdot I\{y_1 < \dots < y_r\} \]
- 指示函数的化简:因为次序统计量是严格递增的,即 \(y_1 < y_2 < \dots < y_r\),因此只要 \(y_1 \geqslant \mu\),就一定有 \(y_2,\dots,y_r \geqslant \mu\)。因此乘积里的 \(r\) 个指示函数 \(\prod_{i=1}^r I\{y_i \geqslant \mu\}\),可以直接简化为 \(I\{y_1 \geqslant \mu\}\),这是很多同学推导时容易卡住的细节。
- 常数项的合并:乘积里的 \(\frac{1}{\sigma}\) 一共有r个,因此合并为 \(\frac{1}{\sigma^r}\)。
- 指数项的合并:指数部分是求和形式,我们把所有指数提出来:\[\exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r (y_i - \mu) + (n-r)(y_r - \mu) \right] \right\} \]展开括号里的项:\[\sum_{i=1}^r (y_i - \mu) + (n-r)(y_r - \mu) = \sum_{i=1}^r y_i + (n-r)y_r - r\mu - (n-r)\mu = \sum_{i=1}^r y_i + (n-r)y_r - n\mu \]
3. 最终化简结果
把以上所有化简合并,最终得到前r个次序统计量的联合密度:
4. 结果的核心解读
这个化简后的式子,直接揭示了两个核心统计量:
- \(Y_1 = X_{(1)}\):第一个失效时间,也就是最小次序统计量;
- \(T_{n,r} = \sum_{i=1}^r Y_i + (n-r)Y_r\):定数截尾总试验时间。
这里给大家讲清楚\(T_{n,r}\)的工程意义:
- 前r个样本,分别在\(Y_1,Y_2,\dots,Y_r\)时刻失效,每个样本的试验时间就是它的失效时间;
- 剩下的\(n-r\)个样本,在试验停止时(\(Y_r\)时刻)还没有失效,每个样本的试验时间都是\(Y_r\);
- 因此所有样本的总试验时间,就是 \(\sum_{i=1}^r Y_i + (n-r)Y_r\),这是可靠性统计中估计参数的核心统计量。
联合密度完全由\(Y_1\)和\(T_{n,r}\)决定,这为我们后续的定理证明指明了方向。
四、核心定理1.6.3 深度讲解与证明
定理1.6.3是本节的核心,它完整揭示了指数分布次序统计量的分布、独立性,是截尾寿命试验参数估计的理论基础。
1. 定理内容拆解
设 \(X_1,\dots,X_n\) 是i.i.d.服从(1.6.12)式的双参数指数分布,定义两个核心统计量:
- 定数截尾总偏差:\(S_1 = \sum_{i=1}^r [X_{(i)}-X_{(1)}] + (n-r)[X_{(r)}-X_{(1)}] = T_{n,r} - nX_{(1)}\)
- 全样本总偏差:\(S = \sum_{i=1}^n [X_{(i)}-X_{(1)}] = \sum_{i=1}^n X_i - nX_{(1)}\)(即\(r=n\)时的\(S_1\))
定理给出三个核心结论:
- 独立性:最小次序统计量 \(X_{(1)}\) 与 \(S_1\)、\(S\) 相互独立;
- 最小次序统计量的分布:\(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\),即\(X_{(1)}-\mu\)服从尺度参数为\(\sigma/n\)的指数分布;
- 总偏差的分布:\(S_1 \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right)\),\(S \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\)。
2. 证明过程逐段拆解
教材中证明的核心是构造归一化间距变换,把不独立的次序统计量,转化为独立的指数分布随机变量,这是指数分布独有的经典变换。
步骤1:构造变换与反变换
我们针对前r个次序统计量 \(Y_1<Y_2<\dots<Y_r\),构造如下变换:
这个变换的本质是:对相邻次序统计量的间距,乘以剩余样本量进行“归一化”。我们可以反解出用\(Z\)表示\(Y\)的表达式:
步骤2:计算雅可比行列式
多元随机变量变换的核心是计算雅可比行列式 \(J = \frac{\partial(y_1,\dots,y_r)}{\partial(z_1,\dots,z_r)}\)。
观察反变换的结构:\(Y_k\) 仅和 \(Z_1,\dots,Z_k\) 有关,和 \(Z_{k+1},\dots,Z_r\) 无关,因此雅可比矩阵是下三角矩阵,下三角矩阵的行列式等于对角线元素的乘积。
我们计算对角线元素:
- \(\frac{\partial y_1}{\partial z_1} = \frac{1}{n}\)
- \(\frac{\partial y_2}{\partial z_2} = \frac{1}{n-1}\)
- \(\frac{\partial y_3}{\partial z_3} = \frac{1}{n-2}\)
- \(\dots\)
- \(\frac{\partial y_r}{\partial z_r} = \frac{1}{n-r+1}\)
因此雅可比行列式为:
和教材中的结果完全一致。
步骤3:推导\(Z_1,\dots,Z_r\)的联合密度
根据多元随机变量变换公式,\(Z\)的联合密度为:
我们把前r个次序统计量的联合密度(1.6.13)和雅可比行列式代入:
首先,常数项 \(\frac{n!}{(n-r)!}\) 和 \(\frac{(n-r)!}{n!}\) 直接抵消,剩下 \(\frac{1}{\sigma^r}\)。
接下来是最关键的一步:指数部分的化简。我们先看变换的一个核心恒等式:
这个恒等式大家可以自己展开验证,它的意义是:所有归一化间距的和,恰好等于总试验时间\(T_{n,r}\)。
同时,\(Z_1 = nY_1\),因此 \(nY_1 = Z_1\),指数部分的 \(n\mu\) 可以和\(Z_1\)结合。
因此指数部分可以化简为:
最后是指示函数的化简:
- \(y_1 \geqslant \mu \implies \frac{Z_1}{n} \geqslant \mu \implies Z_1 \geqslant n\mu\)
- \(y_1 < y_2 < \dots < y_r \implies Z_i \geqslant 0,\ i=2,\dots,r\)(因为间距\(Y_i-Y_{i-1}>0\))
把所有部分合并,最终\(Z\)的联合密度可以拆分为:
步骤4:从联合密度推导独立性与分布
我们知道,多元随机变量相互独立的充要条件是:联合密度可以分解为各变量边缘密度的乘积。
上面的式子中,联合密度完美拆成了r个独立函数的乘积,因此我们直接得到两个核心结论:
- \(Z_1,Z_2,\dots,Z_r\) 相互独立;
- 每个变量的分布:
- \(Z_1 = nY_1 \sim n\mu + \Gamma\left( \frac{1}{\sigma},1 \right)\),即\(Z_1 - n\mu\)服从尺度参数为\(\sigma\)的指数分布;
- \(Z_2,Z_3,\dots,Z_r\) 独立同分布,均服从 \(\Gamma\left( \frac{1}{\sigma},1 \right)\)(标准指数分布)。
接下来我们推导定理的三个结论:
-
\(X_{(1)}\)的分布:
由 \(Z_1 = nX_{(1)}\),得 \(X_{(1)} = \frac{Z_1}{n}\),因此:\[X_{(1)} - \mu = \frac{Z_1 - n\mu}{n} \sim \Gamma\left( \frac{n}{\sigma}, 1 \right) \]即 \(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\),结论(2)得证。
-
\(S_1\)的分布与独立性:
由定义,\(S_1 = T_{n,r} - nX_{(1)} = (Z_1+\dots+Z_r) - Z_1 = Z_2 + Z_3 + \dots + Z_r\)。
因为 \(Z_1\) 与 \(Z_2,\dots,Z_r\) 独立,因此 \(X_{(1)} = Z_1/n\) 与 \(S_1 = Z_2+\dots+Z_r\) 独立。
又因为独立Gamma分布的可加性:\(k\)个独立同分布的\(\Gamma(1/\sigma,1)\)之和,服从\(\Gamma(1/\sigma,k)\)。这里\(Z_2\)到\(Z_r\)共\(r-1\)个独立指数变量,因此:\[S_1 = Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right) \]结论(1)和(3)的\(S_1\)部分得证。
-
\(S\)的分布:
当\(r=n\)时,\(S_1=S\),代入上面的结论,直接得到 \(S \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\),且与\(X_{(1)}\)独立,定理全部得证。
3. 特殊情况:标准指数分布(\(\mu=0\))
当位置参数\(\mu=0\)时,指数分布退化为标准指数分布 \(X_1 \sim \Gamma(1/\sigma,1)\),此时所有结论都可以简化:
- 前r个次序统计量的联合密度简化为:\[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r \right] \right\} I\{y_1 \geqslant 0\} I\{y_1 < \dots < y_r\} \tag{1.6.17} \]
- 总试验时间的分布:\(T_{n,r} = Z_1+Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r \right)\),因为此时\(Z_1\)也服从\(\Gamma(1/\sigma,1)\),和\(Z_2,\dots,Z_r\)独立同分布,r个独立指数变量之和服从Gamma分布。
五、核心推论:间距的独立性
定理的直接推论,是指数分布次序统计量最经典的性质:相邻间距的独立性。
1. 推论内容
设 \(X_1,\dots,X_n\) 是i.i.d.服从双参数指数分布的样本,则:
- 最小次序统计量与所有相邻间距相互独立:\(X_{(1)},\ X_{(2)}-X_{(1)},\ X_{(3)}-X_{(2)},\ \dots,\ X_{(n)}-X_{(n-1)}\) 相互独立;
- 任意次序统计量与后续的剩余寿命独立:对任意的\(i,k\),\(X_{(i)}\) 与 \(X_{(i+k)}-X_{(i)}\) 相互独立。
2. 证明与本质解读
这个推论的证明非常直接:
在定理的变换中,当\(r=n\)时,我们构造的变换为:
我们已经证明了\(Z_1,Z_2,\dots,Z_n\)相互独立,而\(X_{(1)}=Z_1/n\),\(X_{(i)}-X_{(i-1)}=Z_i/(n-i+1)\),都是\(Z_i\)的线性变换,因此它们必然相互独立,第一个结论得证。
第二个结论的本质,就是指数分布的无记忆性:
\(X_{(i)}\) 是第i个失效时间,\(X_{(i+k)}-X_{(i)}\) 是从第i个失效到第i+k个失效的时间间隔。因为指数分布无记忆,到第i个失效时,剩余的\(n-i\)个样本的剩余寿命,和全新的样本完全相同,和之前的失效时间\(X_{(i)}\)没有任何关系,因此二者独立。
3. 与均匀分布的核心区别
这里必须给大家划清两个分布的性质边界,避免混淆:
| 分布类型 | 次序统计量间距的核心性质 |
|---|---|
| 均匀分布 | 等间隔的间距同分布,但不独立 |
| 指数分布 | 归一化后的间距独立同分布,天然满足无记忆性 |
这是两个分布最本质的区别,也是它们应用场景的核心分界:均匀分布的性质用于非参数无分布检验,指数分布的性质用于参数化的可靠性与寿命分析。
六、工程应用价值与总结
1. 核心应用场景
这个知识点的所有结论,最终都落地到可靠性工程的定数截尾寿命试验中:
- 参数估计:对于双参数指数分布,\(X_{(1)}\) 是位置参数\(\mu\)的充分完备统计量,\(S_1/S\) 是尺度参数\(\sigma\)的充分完备统计量,我们可以直接用这两个统计量构造\(\mu\)和\(\sigma\)的无偏估计、置信区间;
- 假设检验:利用\(S_1\)的Gamma分布,可以构造关于失效率\(\lambda=1/\sigma\)的检验,判断产品的寿命是否达到设计要求;
- 加速寿命试验:基于指数分布次序统计量的性质,可以设计定数截尾的加速寿命试验,大幅缩短试验时间,评估产品的长期寿命。
2. 全知识点核心总结
- 指数分布的次序统计量,是定数截尾寿命试验的核心数据基础,前r个次序统计量的联合密度完全由最小失效时间和总试验时间决定;
- 核心定理的本质,是通过归一化间距变换,将次序统计量转化为独立的指数分布随机变量,从而得到最小次序统计量和总试验时间的分布与独立性;
- 相邻间距的独立性,是指数分布无记忆性的直接体现,也是它区别于其他分布的核心特征;
- 所有结论都可以直接推广到截尾寿命试验的统计推断中,是可靠性统计的理论基石。
指数分布的次序统计量 知识点全归纳表格汇总
以下表格严格对应教材公式、定理推导与工程应用逻辑,完整覆盖基础定义、公式推导、核心定理、证明关键、性质对比与落地场景,可直接用于公式速查、备课与可靠性统计知识点梳理。
表1 基础前提与指数分布核心定义
| 分类 | 核心内容 | 教材对应/公式编号 | 关键说明与本质意义 |
|---|---|---|---|
| 双参数指数分布定义 | \(X_1 \sim \mu + \Gamma(1/\sigma,1)\),其中失效率 \(\lambda=1/\sigma\) | 开篇定义 | 1. \(\mu\):位置参数/保证寿命,产品在\(\mu\)前绝对不失效,样本满足 \(X\geqslant\mu\) 2. \(\sigma\):尺度参数/特征寿命,决定失效速率 3. 形状参数为1的Gamma分布,退化为指数分布 |
| 概率密度函数(PDF) | \(f(x_1) = \frac{1}{\sigma} \mathrm{e}^{-\frac{x_1-\mu}{\sigma}} I\{x_1 \geqslant \mu\}\) | (1.6.12) | 仅在 \(x\geqslant\mu\) 时有非零取值,呈指数衰减趋势 |
| 分布函数(CDF) | \(F(x_1) = \left(1 - \mathrm{e}^{-\frac{x_1-\mu}{\sigma}}\right) I\{x_1 \geqslant \mu\}\) | (1.6.12) | 生存函数(可靠度)为 \(S(x)=1-F(x)=\mathrm{e}^{-\frac{x-\mu}{\sigma}}\),是可靠性计算的核心 |
| 核心特性 | 无记忆性:对任意 \(s,t>0\),\(P(X>s+t \mid X>s)=P(X>t)\) | 基础特性 | 产品无老化效应,已工作时间不影响剩余寿命,是后续间距独立性的本质来源 |
| 次序统计量的工程背景 | 定数截尾寿命试验:投n个样本,观测前r个失效时间 \(X_{(1)}<X_{(2)}<\dots<X_{(r)}\)(\(r\leqslant n\)),即前r个次序统计量 | 开篇说明 | 是可靠性工程中最常用的试验方案,无需等待所有样本失效,大幅降低时间成本 |
表2 前r个次序统计量的联合密度推导汇总
| 推导步骤 | 公式内容 | 教材公式编号 | 关键化简逻辑 |
|---|---|---|---|
| 通用前r个次序统计量联合密度 | \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left[ \prod_{i=1}^r f(y_i) \right] [1-F(y_r)]^{n-r} I\{y_1 < \dots < y_r\}\) | (1.6.8) | 核心逻辑:r个样本落在r个微小区间,剩余\(n-r\)个样本全部大于\(y_r\),组合数为排列数 \(\frac{n!}{(n-r)!}\) |
| 代入指数分布的f与F | \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left( \prod_{i=1}^r \frac{1}{\sigma} \mathrm{e}^{-\frac{y_i-\mu}{\sigma}} I\{y_i \geqslant \mu\} \right) \cdot \left( \mathrm{e}^{-\frac{y_r-\mu}{\sigma}} \right)^{n-r} \cdot I\{y_1 < \dots < y_r\}\) | 推导中间式 | 代入指数分布的PDF和生存函数 \(1-F(y_r)=\mathrm{e}^{-\frac{y_r-\mu}{\sigma}}\) |
| 指示函数与常数项化简 | 1. \(\prod_{i=1}^r I\{y_i \geqslant \mu\} = I\{y_1 \geqslant \mu\}\) 2. \(\prod_{i=1}^r \frac{1}{\sigma} = \frac{1}{\sigma^r}\) |
推导中间式 | 利用次序统计量的递增性:\(y_1\geqslant\mu\) 可推出所有 \(y_i\geqslant\mu\),简化指示函数 |
| 指数项合并 | \(\exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r (y_i-\mu) + (n-r)(y_r-\mu) \right] \right\} = \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\}\) | 推导中间式 | 展开并合并常数项,最终消去\(r\mu\)与\((n-r)\mu\),得到\(n\mu\) |
| 最终化简结果 | \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\} I\{y_1 \geqslant \mu\} I\{y_1 < \dots < y_r\}\) | (1.6.13) | 联合密度完全由两个核心统计量决定:最小次序统计量\(Y_1=X_{(1)}\)、总试验时间\(T_{n,r}\) |
| 核心统计量解读 | 总试验时间:\(T_{n,r} = \sum_{i=1}^r y_i + (n-r)y_r\) | 定义式 | 工程意义:前r个失效样本的总试验时间 + 剩余\(n-r\)个未失效样本的总试验时间,是参数估计的核心统计量 |
表3 定理1.6.3 核心结论完整汇总
| 结论分类 | 核心公式与分布结论 | 教材公式编号 | 证明核心逻辑 | 关键意义 |
|---|---|---|---|---|
| 独立性结论 | 最小次序统计量 \(X_{(1)}\) 与 \(S_1\)、\(S\) 相互独立 | 定理核心结论 | 构造归一化间距变换后,\(X_{(1)}\) 仅与\(Z_1\)有关,\(S_1/S\)仅与\(Z_2,\dots,Z_r\)有关,而\(Z_1\)与其他\(Z_i\)独立 | 解决了双参数指数分布参数估计的独立性问题,可分别构造两个参数的估计量 |
| 最小次序统计量的分布 | \(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\) | (1.6.16) | 由\(Z_1 = nX_{(1)} \sim n\mu + \Gamma(1/\sigma,1)\),做线性变换推导得到 | \(X_{(1)}-\mu\) 服从尺度参数为\(\sigma/n\)的指数分布,是位置参数\(\mu\)的充分完备统计量 |
| 定数截尾总偏差\(S_1\)的分布 | \(S_1 = T_{n,r} - nX_{(1)} \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right)\) | (1.6.14)(1.6.16) | \(S_1 = Z_2+\dots+Z_r\),是\(r-1\)个独立同分布的\(\Gamma(1/\sigma,1)\)变量之和,由Gamma分布可加性推导 | 是尺度参数\(\sigma\)的核心估计量,可直接用于构造\(\sigma\)的置信区间与假设检验 |
| 全样本总偏差\(S\)的分布 | \(S = \sum_{i=1}^n X_i - nX_{(1)} \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\) | (1.6.15)(1.6.16) | \(r=n\)时\(S_1=S\),代入\(S_1\)的分布结论直接得到 | 全样本试验下,尺度参数\(\sigma\)的核心估计量 |
| 标准指数分布特例(\(\mu=0\)) | 1. \(X_{(1)} \sim \Gamma\left( \frac{n}{\sigma}, 1 \right)\) 2. 联合密度简化为:\(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r \right] \right\} I\{y_1 \geqslant 0\} I\{y_1 < \dots < y_r\}\) |
(1.6.17) | 令\(\mu=0\),代入通用公式直接化简 | 单参数指数分布的核心公式,是最常用的工程简化形式 |
| 总试验时间\(T_{n,r}\)的分布(\(\mu=0\)) | \(T_{n,r} = Z_1+Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r \right)\) | (1.6.18)(1.6.19) | \(\mu=0\)时\(Z_1\sim\Gamma(1/\sigma,1)\),与\(Z_2,\dots,Z_r\)独立同分布,r个Gamma变量之和服从\(\Gamma(1/\sigma,r)\) | 定数截尾试验下,总试验时间的分布完全已知,可用于试验方案设计 |
表4 定理证明核心变换与关键步骤汇总
| 变换环节 | 核心公式 | 关键计算结果 | 推导意义 |
|---|---|---|---|
| 归一化间距变换构造 | \(\begin{cases} Z_1 = nX_{(1)} \\ Z_2 = (n-1)[X_{(2)}-X_{(1)}] \\ \quad \vdots \\ Z_r = (n-r+1)[X_{(r)}-X_{(r-1)}] \end{cases}\) | 对相邻间距乘以剩余样本量做归一化 | 打破次序统计量的大小约束,为独立性推导做铺垫,是指数分布独有的经典变换 |
| 反变换(Z表示Y) | \(\begin{cases} Y_1 = \frac{Z_1}{n} \\ Y_2 = \frac{Z_1}{n} + \frac{Z_2}{n-1} \\ \quad \vdots \\ Y_r = \frac{Z_1}{n} + \frac{Z_2}{n-1} + \dots + \frac{Z_r}{n-r+1} \end{cases}\) | 雅可比矩阵为下三角矩阵,上三角部分全为0 | 建立Y与Z的一一映射,满足多元随机变量变换的条件 |
| 雅可比行列式计算 | \(J = \frac{\partial(y_1,\dots,y_r)}{\partial(z_1,\dots,z_r)}\) | \(J = \frac{1}{n} \cdot \frac{1}{n-1} \cdot \dots \cdot \frac{1}{n-r+1} = \frac{(n-r)!}{n!}\) | 下三角矩阵的行列式等于对角线元素乘积,是多元密度变换的核心 |
| 核心恒等式 | \(Z_1+Z_2+\dots+Z_r = \sum_{i=1}^r Y_i + (n-r)Y_r = T_{n,r}\) | 归一化间距的和恰好等于总试验时间 | 大幅简化指数项的化简,直接建立变换与核心统计量的关联 |
| Z的联合密度化简 | \(f(z_1,\dots,z_r) = \left[ \frac{1}{\sigma} \mathrm{e}^{-\frac{1}{\sigma}(Z_1-n\mu)} I\{Z_1\geqslant n\mu\} \right] \cdot \prod_{i=2}^r \left[ \frac{1}{\sigma} \mathrm{e}^{-\frac{1}{\sigma}Z_i} I\{Z_i\geqslant0\} \right]\) | 联合密度可完全分解为r个单变量密度的乘积 | 直接证明\(Z_1,\dots,Z_r\)相互独立,是定理结论的核心支撑 |
| 分布推导 | 1. \(Z_1 \sim n\mu + \Gamma(1/\sigma,1)\) 2. \(Z_2,\dots,Z_r \overset{i.i.d.}{\sim} \Gamma(1/\sigma,1)\) |
每个\(Z_i\)的边缘分布均为指数分布 | 利用Gamma分布的可加性,直接推导\(S_1\)、\(T_{n,r}\)的分布 |
表5 核心推论与分布性质对比
| 分类 | 核心结论 | 证明逻辑 | 本质解读 |
|---|---|---|---|
| 相邻间距的独立性 | \(X_{(1)},\ X_{(2)}-X_{(1)},\ X_{(3)}-X_{(2)},\ \dots,\ X_{(n)}-X_{(n-1)}\) 相互独立 | \(r=n\)时,\(Z_1,\dots,Z_n\)相互独立,而间距是\(Z_i\)的线性变换,因此保持独立性 | 指数分布无记忆性的直接体现:每次失效后,剩余样本的剩余寿命与全新样本一致,与之前的失效时间无关 |
| 次序统计量与剩余寿命的独立性 | 对任意\(i,k\),\(X_{(i)}\) 与 \(X_{(i+k)}-X_{(i)}\) 相互独立 | \(X_{(i)} = \sum_{j=1}^i W_j\),\(X_{(i+k)}-X_{(i)} = \sum_{j=i+1}^{i+k} W_j\),而\(W_j\)相互独立,因此二者独立 | 无记忆性的推广:第i个失效时间不影响后续的失效间隔时间,是生存分析中剩余寿命预测的理论基础 |
| 指数分布vs均匀分布 次序统计量性质核心对比 | 1. 指数分布:归一化间距独立同分布 2. 均匀分布:等间隔间距同分布但不独立 |
指数分布的无记忆性决定了间距独立;均匀分布的区间对称性决定了间距同分布,但大小约束导致不独立 | 两个分布的核心分界: - 指数分布性质用于参数化可靠性与寿命分析 - 均匀分布性质用于非参数无分布检验 |
表6 工程应用场景与落地价值
| 应用场景 | 对应核心知识点 | 实际工程用途 |
|---|---|---|
| 定数截尾寿命试验参数估计 | 前r个次序统计量的联合密度、\(X_{(1)}\)与\(S_1\)的分布与独立性 | 构造双参数指数分布中位置参数\(\mu\)、尺度参数\(\sigma\)的无偏估计、极大似然估计与置信区间 |
| 产品失效率假设检验 | \(S_1\)的Gamma分布性质 | 检验产品的失效率是否达到设计要求,判断产品是否满足可靠性指标 |
| 加速寿命试验方案设计 | 总试验时间\(T_{n,r}\)的分布、次序统计量的间距性质 | 设计定数截尾加速寿命试验,缩短试验周期,评估产品的长期寿命与可靠性 |
| 产品剩余寿命预测 | 次序统计量与剩余寿命的独立性 | 基于已失效样本的观测数据,预测剩余未失效样本的剩余寿命,制定维护与更换策略 |
| 可靠性验证试验 | 最小次序统计量的分布 | 设计验证试验方案,验证产品的保证寿命\(\mu\)是否满足设计要求 |
posted on 2026-02-20 07:57 Indian_Mysore 阅读(1) 评论(0) 收藏 举报
浙公网安备 33010602011771号