昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.6.3指数分布的次序统计量

指数分布的次序统计量 深度系统讲解

各位同学,今天我们来拆解指数分布的次序统计量这个知识点。这个知识点是可靠性统计、生存分析、寿命数据建模的绝对核心——指数分布的无记忆性,赋予了它的次序统计量独一无二的性质,这是其他任何分布都不具备的。我们从底层定义、公式推导、定理证明到应用价值,一步一步拆透,不仅让你会算公式,更能理解它背后的统计思想与工程意义。


一、开篇:为什么要专门研究指数分布的次序统计量?

在正式推导之前,我们必须先搞懂这个知识点的核心定位:

  1. 指数分布的核心地位:指数分布是描述“无老化、无记忆”寿命的唯一连续型分布,电子元器件的寿命、设备的故障间隔时间、生物的生存时间,绝大多数都用指数分布建模,是可靠性工程与生存分析的“基础分布”。
  2. 次序统计量的工程意义:在寿命试验中,我们不可能等到所有样本都失效(时间成本极高),通常只观测前r个失效的样本(定数截尾试验),这些失效时间就是指数分布样本的前r个次序统计量。因此,指数分布的次序统计量,是截尾寿命试验统计推断的唯一数据基础
  3. 独有的核心特性:指数分布的次序统计量,其间距具有独立性——这是指数分布无记忆性的直接体现,也是它和均匀分布、正态分布次序统计量最本质的区别。均匀分布的间距同分布但不独立,而指数分布的归一化间距独立同分布,这个性质直接决定了它在工程中的易用性。

二、基础铺垫:指数分布的定义与核心特性

首先我们明确教材中指数分布的参数形式,避免大家和其他参数定义混淆。

1. 位置-尺度型指数分布的定义

教材中给出的指数分布为带位置参数的双参数指数分布,记为 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\),其中:

  • \(\mu\)位置参数,也叫“保证寿命”——产品在时间\(\mu\)之前绝对不会失效,只有超过\(\mu\)才会发生失效,因此样本取值一定满足 \(X \geqslant \mu\)
  • \(\sigma\)尺度参数,也叫“特征寿命”,失效率 \(\lambda = 1/\sigma\) 为常数,这是指数分布无记忆性的核心;
  • \(\Gamma(\alpha,\lambda)\):Gamma分布,当形状参数\(\alpha=1\)时,Gamma分布退化为指数分布,因此标准指数分布(\(\mu=0,\sigma=1\))就是 \(\Gamma(1,1)\)

对应的概率密度函数(PDF)和分布函数(CDF)为:

\[f(x_1) = \frac{1}{\sigma} \mathrm{e}^{-\frac{x_1-\mu}{\sigma}} I\{x_1 \geqslant \mu\}, \quad F(x_1) = \left(1 - \mathrm{e}^{-\frac{x_1-\mu}{\sigma}}\right) I\{x_1 \geqslant \mu\} \tag{1.6.12} \]

其中 \(I\{\cdot\}\) 是指示函数,满足条件时取1,否则取0。

2. 核心特性:无记忆性

指数分布的所有性质,都源于它的无记忆性:对于任意 \(s,t>0\),有

\[P(X > s+t \mid X > s) = P(X > t) \]

翻译成工程语言就是:一个已经工作了\(s\)小时的产品,它再工作\(t\)小时的概率,和一个全新的产品工作\(t\)小时的概率完全相同——产品不会“老化”,过去的工作时间不影响未来的寿命。

我们后续推导的次序统计量间距的独立性,本质就是无记忆性的直接体现。


三、前r个次序统计量的联合密度推导

在寿命试验中,我们最常用的是定数截尾试验:投n个样本进行寿命试验,观测到前r个样本失效就停止试验,得到的观测数据就是前r个次序统计量 \(X_{(1)} < X_{(2)} < \dots < X_{(r)}\)\(r \leqslant n\))。因此我们首先推导它的联合概率密度。

1. 回顾通用公式

上一节我们已经推导了任意连续型分布前r个次序统计量的联合密度通用公式:

\[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left[ \prod_{i=1}^r f(y_i) \right] [1-F(y_r)]^{n-r} I\{y_1 < y_2 < \dots < y_r\} \tag{1.6.8} \]

这个公式的本质是:r个样本分别落在r个微小区间,剩下的\(n-r\)个样本全部大于\(y_r\),组合数为排列数 \(\frac{n!}{(n-r)!}\)

2. 代入指数分布的f和F,逐步化简

我们记 \(Y_i = X_{(i)}\),将指数分布的\(f(y_i)\)\(F(y_r)\)代入通用公式:

  1. 首先代入密度和生存函数(\(1-F(y_r)\) 也叫生存函数,记为\(S(y_r)=P(X>y_r)\)):

    \[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left[ \prod_{i=1}^r \frac{1}{\sigma} \mathrm{e}^{-\frac{y_i-\mu}{\sigma}} I\{y_i \geqslant \mu\} \right] \cdot \left( \mathrm{e}^{-\frac{y_r-\mu}{\sigma}} \right)^{n-r} \cdot I\{y_1 < \dots < y_r\} \]

  2. 指示函数的化简:因为次序统计量是严格递增的,即 \(y_1 < y_2 < \dots < y_r\),因此只要 \(y_1 \geqslant \mu\),就一定有 \(y_2,\dots,y_r \geqslant \mu\)。因此乘积里的 \(r\) 个指示函数 \(\prod_{i=1}^r I\{y_i \geqslant \mu\}\),可以直接简化为 \(I\{y_1 \geqslant \mu\}\),这是很多同学推导时容易卡住的细节。
  3. 常数项的合并:乘积里的 \(\frac{1}{\sigma}\) 一共有r个,因此合并为 \(\frac{1}{\sigma^r}\)
  4. 指数项的合并:指数部分是求和形式,我们把所有指数提出来:

    \[\exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r (y_i - \mu) + (n-r)(y_r - \mu) \right] \right\} \]

    展开括号里的项:

    \[\sum_{i=1}^r (y_i - \mu) + (n-r)(y_r - \mu) = \sum_{i=1}^r y_i + (n-r)y_r - r\mu - (n-r)\mu = \sum_{i=1}^r y_i + (n-r)y_r - n\mu \]

3. 最终化简结果

把以上所有化简合并,最终得到前r个次序统计量的联合密度:

\[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\} I\{y_1 \geqslant \mu\} I\{y_1 < \dots < y_r\} \tag{1.6.13} \]

4. 结果的核心解读

这个化简后的式子,直接揭示了两个核心统计量:

  1. \(Y_1 = X_{(1)}\):第一个失效时间,也就是最小次序统计量;
  2. \(T_{n,r} = \sum_{i=1}^r Y_i + (n-r)Y_r\)定数截尾总试验时间

这里给大家讲清楚\(T_{n,r}\)的工程意义:

  • 前r个样本,分别在\(Y_1,Y_2,\dots,Y_r\)时刻失效,每个样本的试验时间就是它的失效时间;
  • 剩下的\(n-r\)个样本,在试验停止时(\(Y_r\)时刻)还没有失效,每个样本的试验时间都是\(Y_r\)
  • 因此所有样本的总试验时间,就是 \(\sum_{i=1}^r Y_i + (n-r)Y_r\),这是可靠性统计中估计参数的核心统计量。

联合密度完全由\(Y_1\)\(T_{n,r}\)决定,这为我们后续的定理证明指明了方向。


四、核心定理1.6.3 深度讲解与证明

定理1.6.3是本节的核心,它完整揭示了指数分布次序统计量的分布、独立性,是截尾寿命试验参数估计的理论基础。

1. 定理内容拆解

\(X_1,\dots,X_n\) 是i.i.d.服从(1.6.12)式的双参数指数分布,定义两个核心统计量:

  • 定数截尾总偏差:\(S_1 = \sum_{i=1}^r [X_{(i)}-X_{(1)}] + (n-r)[X_{(r)}-X_{(1)}] = T_{n,r} - nX_{(1)}\)
  • 全样本总偏差:\(S = \sum_{i=1}^n [X_{(i)}-X_{(1)}] = \sum_{i=1}^n X_i - nX_{(1)}\)(即\(r=n\)时的\(S_1\)

定理给出三个核心结论:

  1. 独立性:最小次序统计量 \(X_{(1)}\)\(S_1\)\(S\) 相互独立;
  2. 最小次序统计量的分布\(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\),即\(X_{(1)}-\mu\)服从尺度参数为\(\sigma/n\)的指数分布;
  3. 总偏差的分布\(S_1 \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right)\)\(S \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\)

2. 证明过程逐段拆解

教材中证明的核心是构造归一化间距变换,把不独立的次序统计量,转化为独立的指数分布随机变量,这是指数分布独有的经典变换。

步骤1:构造变换与反变换

我们针对前r个次序统计量 \(Y_1<Y_2<\dots<Y_r\),构造如下变换:

\[\begin{cases} Z_1 = nX_{(1)} = nY_1 \\ Z_2 = (n-1)[X_{(2)}-X_{(1)}] = (n-1)(Y_2-Y_1) \\ Z_3 = (n-2)[X_{(3)}-X_{(2)}] = (n-2)(Y_3-Y_2) \\ \quad \vdots \\ Z_r = (n-r+1)[X_{(r)}-X_{(r-1)}] = (n-r+1)(Y_r-Y_{r-1}) \end{cases} \]

这个变换的本质是:对相邻次序统计量的间距,乘以剩余样本量进行“归一化”。我们可以反解出用\(Z\)表示\(Y\)的表达式:

\[\begin{cases} Y_1 = \frac{Z_1}{n} \\ Y_2 = \frac{Z_1}{n} + \frac{Z_2}{n-1} \\ Y_3 = \frac{Z_1}{n} + \frac{Z_2}{n-1} + \frac{Z_3}{n-2} \\ \quad \vdots \\ Y_r = \frac{Z_1}{n} + \frac{Z_2}{n-1} + \dots + \frac{Z_r}{n-r+1} \end{cases} \]

步骤2:计算雅可比行列式

多元随机变量变换的核心是计算雅可比行列式 \(J = \frac{\partial(y_1,\dots,y_r)}{\partial(z_1,\dots,z_r)}\)

观察反变换的结构:\(Y_k\) 仅和 \(Z_1,\dots,Z_k\) 有关,和 \(Z_{k+1},\dots,Z_r\) 无关,因此雅可比矩阵是下三角矩阵,下三角矩阵的行列式等于对角线元素的乘积。

我们计算对角线元素:

  • \(\frac{\partial y_1}{\partial z_1} = \frac{1}{n}\)
  • \(\frac{\partial y_2}{\partial z_2} = \frac{1}{n-1}\)
  • \(\frac{\partial y_3}{\partial z_3} = \frac{1}{n-2}\)
  • \(\dots\)
  • \(\frac{\partial y_r}{\partial z_r} = \frac{1}{n-r+1}\)

因此雅可比行列式为:

\[J = \frac{1}{n} \cdot \frac{1}{n-1} \cdot \frac{1}{n-2} \cdot \dots \cdot \frac{1}{n-r+1} = \frac{(n-r)!}{n!} \]

和教材中的结果完全一致。

步骤3:推导\(Z_1,\dots,Z_r\)的联合密度

根据多元随机变量变换公式,\(Z\)的联合密度为:

\[f(z_1,\dots,z_r) = f(y_1,\dots,y_r) \cdot |J| \]

我们把前r个次序统计量的联合密度(1.6.13)和雅可比行列式代入:

\[f(z_1,\dots,z_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\} \cdot \frac{(n-r)!}{n!} \cdot I\{\cdot\} \]

首先,常数项 \(\frac{n!}{(n-r)!}\)\(\frac{(n-r)!}{n!}\) 直接抵消,剩下 \(\frac{1}{\sigma^r}\)

接下来是最关键的一步:指数部分的化简。我们先看变换的一个核心恒等式:

\[Z_1 + Z_2 + \dots + Z_r = \sum_{i=1}^r y_i + (n-r)y_r = T_{n,r} \]

这个恒等式大家可以自己展开验证,它的意义是:所有归一化间距的和,恰好等于总试验时间\(T_{n,r}\)

同时,\(Z_1 = nY_1\),因此 \(nY_1 = Z_1\),指数部分的 \(n\mu\) 可以和\(Z_1\)结合。

因此指数部分可以化简为:

\[\exp\left\{ -\frac{1}{\sigma} \left( Z_1 + Z_2 + \dots + Z_r - n\mu \right) \right\} = \exp\left\{ -\frac{1}{\sigma}(Z_1 - n\mu) \right\} \cdot \prod_{i=2}^r \exp\left\{ -\frac{1}{\sigma} Z_i \right\} \]

最后是指示函数的化简:

  • \(y_1 \geqslant \mu \implies \frac{Z_1}{n} \geqslant \mu \implies Z_1 \geqslant n\mu\)
  • \(y_1 < y_2 < \dots < y_r \implies Z_i \geqslant 0,\ i=2,\dots,r\)(因为间距\(Y_i-Y_{i-1}>0\)

把所有部分合并,最终\(Z\)的联合密度可以拆分为:

\[f(z_1,\dots,z_r) = \underbrace{\frac{1}{\sigma} \exp\left\{ -\frac{1}{\sigma}(Z_1 - n\mu) \right\} I\{Z_1 \geqslant n\mu\}}_{Z_1的密度} \cdot \prod_{i=2}^r \underbrace{\frac{1}{\sigma} \exp\left\{ -\frac{1}{\sigma} Z_i \right\} I\{Z_i \geqslant 0\}}_{Z_i的密度} \]

步骤4:从联合密度推导独立性与分布

我们知道,多元随机变量相互独立的充要条件是:联合密度可以分解为各变量边缘密度的乘积

上面的式子中,联合密度完美拆成了r个独立函数的乘积,因此我们直接得到两个核心结论:

  1. \(Z_1,Z_2,\dots,Z_r\) 相互独立;
  2. 每个变量的分布:
    • \(Z_1 = nY_1 \sim n\mu + \Gamma\left( \frac{1}{\sigma},1 \right)\),即\(Z_1 - n\mu\)服从尺度参数为\(\sigma\)的指数分布;
    • \(Z_2,Z_3,\dots,Z_r\) 独立同分布,均服从 \(\Gamma\left( \frac{1}{\sigma},1 \right)\)(标准指数分布)。

接下来我们推导定理的三个结论:

  1. \(X_{(1)}\)的分布
    \(Z_1 = nX_{(1)}\),得 \(X_{(1)} = \frac{Z_1}{n}\),因此:

    \[X_{(1)} - \mu = \frac{Z_1 - n\mu}{n} \sim \Gamma\left( \frac{n}{\sigma}, 1 \right) \]

    \(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\),结论(2)得证。

  2. \(S_1\)的分布与独立性
    由定义,\(S_1 = T_{n,r} - nX_{(1)} = (Z_1+\dots+Z_r) - Z_1 = Z_2 + Z_3 + \dots + Z_r\)
    因为 \(Z_1\)\(Z_2,\dots,Z_r\) 独立,因此 \(X_{(1)} = Z_1/n\)\(S_1 = Z_2+\dots+Z_r\) 独立。
    又因为独立Gamma分布的可加性:\(k\)个独立同分布的\(\Gamma(1/\sigma,1)\)之和,服从\(\Gamma(1/\sigma,k)\)。这里\(Z_2\)\(Z_r\)\(r-1\)个独立指数变量,因此:

    \[S_1 = Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right) \]

    结论(1)和(3)的\(S_1\)部分得证。

  3. \(S\)的分布
    \(r=n\)时,\(S_1=S\),代入上面的结论,直接得到 \(S \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\),且与\(X_{(1)}\)独立,定理全部得证。

3. 特殊情况:标准指数分布(\(\mu=0\)

当位置参数\(\mu=0\)时,指数分布退化为标准指数分布 \(X_1 \sim \Gamma(1/\sigma,1)\),此时所有结论都可以简化:

  1. 前r个次序统计量的联合密度简化为:

    \[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r \right] \right\} I\{y_1 \geqslant 0\} I\{y_1 < \dots < y_r\} \tag{1.6.17} \]

  2. 总试验时间的分布:\(T_{n,r} = Z_1+Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r \right)\),因为此时\(Z_1\)也服从\(\Gamma(1/\sigma,1)\),和\(Z_2,\dots,Z_r\)独立同分布,r个独立指数变量之和服从Gamma分布。

五、核心推论:间距的独立性

定理的直接推论,是指数分布次序统计量最经典的性质:相邻间距的独立性

1. 推论内容

\(X_1,\dots,X_n\) 是i.i.d.服从双参数指数分布的样本,则:

  1. 最小次序统计量与所有相邻间距相互独立:\(X_{(1)},\ X_{(2)}-X_{(1)},\ X_{(3)}-X_{(2)},\ \dots,\ X_{(n)}-X_{(n-1)}\) 相互独立;
  2. 任意次序统计量与后续的剩余寿命独立:对任意的\(i,k\)\(X_{(i)}\)\(X_{(i+k)}-X_{(i)}\) 相互独立。

2. 证明与本质解读

这个推论的证明非常直接:
在定理的变换中,当\(r=n\)时,我们构造的变换为:

\[Z_1 = nX_{(1)},\ Z_2=(n-1)(X_{(2)}-X_{(1)}),\ \dots,\ Z_n = 1 \cdot (X_{(n)}-X_{(n-1)}) \]

我们已经证明了\(Z_1,Z_2,\dots,Z_n\)相互独立,而\(X_{(1)}=Z_1/n\)\(X_{(i)}-X_{(i-1)}=Z_i/(n-i+1)\),都是\(Z_i\)的线性变换,因此它们必然相互独立,第一个结论得证。

第二个结论的本质,就是指数分布的无记忆性
\(X_{(i)}\) 是第i个失效时间,\(X_{(i+k)}-X_{(i)}\) 是从第i个失效到第i+k个失效的时间间隔。因为指数分布无记忆,到第i个失效时,剩余的\(n-i\)个样本的剩余寿命,和全新的样本完全相同,和之前的失效时间\(X_{(i)}\)没有任何关系,因此二者独立。

3. 与均匀分布的核心区别

这里必须给大家划清两个分布的性质边界,避免混淆:

分布类型 次序统计量间距的核心性质
均匀分布 等间隔的间距同分布,但不独立
指数分布 归一化后的间距独立同分布,天然满足无记忆性

这是两个分布最本质的区别,也是它们应用场景的核心分界:均匀分布的性质用于非参数无分布检验,指数分布的性质用于参数化的可靠性与寿命分析。


六、工程应用价值与总结

1. 核心应用场景

这个知识点的所有结论,最终都落地到可靠性工程的定数截尾寿命试验中:

  1. 参数估计:对于双参数指数分布,\(X_{(1)}\) 是位置参数\(\mu\)的充分完备统计量,\(S_1/S\) 是尺度参数\(\sigma\)的充分完备统计量,我们可以直接用这两个统计量构造\(\mu\)\(\sigma\)的无偏估计、置信区间;
  2. 假设检验:利用\(S_1\)的Gamma分布,可以构造关于失效率\(\lambda=1/\sigma\)的检验,判断产品的寿命是否达到设计要求;
  3. 加速寿命试验:基于指数分布次序统计量的性质,可以设计定数截尾的加速寿命试验,大幅缩短试验时间,评估产品的长期寿命。

2. 全知识点核心总结

  1. 指数分布的次序统计量,是定数截尾寿命试验的核心数据基础,前r个次序统计量的联合密度完全由最小失效时间和总试验时间决定;
  2. 核心定理的本质,是通过归一化间距变换,将次序统计量转化为独立的指数分布随机变量,从而得到最小次序统计量和总试验时间的分布与独立性;
  3. 相邻间距的独立性,是指数分布无记忆性的直接体现,也是它区别于其他分布的核心特征;
  4. 所有结论都可以直接推广到截尾寿命试验的统计推断中,是可靠性统计的理论基石。

指数分布的次序统计量 知识点全归纳表格汇总

以下表格严格对应教材公式、定理推导与工程应用逻辑,完整覆盖基础定义、公式推导、核心定理、证明关键、性质对比与落地场景,可直接用于公式速查、备课与可靠性统计知识点梳理。


表1 基础前提与指数分布核心定义

分类 核心内容 教材对应/公式编号 关键说明与本质意义
双参数指数分布定义 \(X_1 \sim \mu + \Gamma(1/\sigma,1)\),其中失效率 \(\lambda=1/\sigma\) 开篇定义 1. \(\mu\)位置参数/保证寿命,产品在\(\mu\)前绝对不失效,样本满足 \(X\geqslant\mu\)
2. \(\sigma\)尺度参数/特征寿命,决定失效速率
3. 形状参数为1的Gamma分布,退化为指数分布
概率密度函数(PDF) \(f(x_1) = \frac{1}{\sigma} \mathrm{e}^{-\frac{x_1-\mu}{\sigma}} I\{x_1 \geqslant \mu\}\) (1.6.12) 仅在 \(x\geqslant\mu\) 时有非零取值,呈指数衰减趋势
分布函数(CDF) \(F(x_1) = \left(1 - \mathrm{e}^{-\frac{x_1-\mu}{\sigma}}\right) I\{x_1 \geqslant \mu\}\) (1.6.12) 生存函数(可靠度)为 \(S(x)=1-F(x)=\mathrm{e}^{-\frac{x-\mu}{\sigma}}\),是可靠性计算的核心
核心特性 无记忆性:对任意 \(s,t>0\)\(P(X>s+t \mid X>s)=P(X>t)\) 基础特性 产品无老化效应,已工作时间不影响剩余寿命,是后续间距独立性的本质来源
次序统计量的工程背景 定数截尾寿命试验:投n个样本,观测前r个失效时间 \(X_{(1)}<X_{(2)}<\dots<X_{(r)}\)\(r\leqslant n\)),即前r个次序统计量 开篇说明 是可靠性工程中最常用的试验方案,无需等待所有样本失效,大幅降低时间成本

表2 前r个次序统计量的联合密度推导汇总

推导步骤 公式内容 教材公式编号 关键化简逻辑
通用前r个次序统计量联合密度 \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left[ \prod_{i=1}^r f(y_i) \right] [1-F(y_r)]^{n-r} I\{y_1 < \dots < y_r\}\) (1.6.8) 核心逻辑:r个样本落在r个微小区间,剩余\(n-r\)个样本全部大于\(y_r\),组合数为排列数 \(\frac{n!}{(n-r)!}\)
代入指数分布的f与F \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \left( \prod_{i=1}^r \frac{1}{\sigma} \mathrm{e}^{-\frac{y_i-\mu}{\sigma}} I\{y_i \geqslant \mu\} \right) \cdot \left( \mathrm{e}^{-\frac{y_r-\mu}{\sigma}} \right)^{n-r} \cdot I\{y_1 < \dots < y_r\}\) 推导中间式 代入指数分布的PDF和生存函数 \(1-F(y_r)=\mathrm{e}^{-\frac{y_r-\mu}{\sigma}}\)
指示函数与常数项化简 1. \(\prod_{i=1}^r I\{y_i \geqslant \mu\} = I\{y_1 \geqslant \mu\}\)
2. \(\prod_{i=1}^r \frac{1}{\sigma} = \frac{1}{\sigma^r}\)
推导中间式 利用次序统计量的递增性:\(y_1\geqslant\mu\) 可推出所有 \(y_i\geqslant\mu\),简化指示函数
指数项合并 \(\exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r (y_i-\mu) + (n-r)(y_r-\mu) \right] \right\} = \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\}\) 推导中间式 展开并合并常数项,最终消去\(r\mu\)\((n-r)\mu\),得到\(n\mu\)
最终化简结果 \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r - n\mu \right] \right\} I\{y_1 \geqslant \mu\} I\{y_1 < \dots < y_r\}\) (1.6.13) 联合密度完全由两个核心统计量决定:最小次序统计量\(Y_1=X_{(1)}\)、总试验时间\(T_{n,r}\)
核心统计量解读 总试验时间:\(T_{n,r} = \sum_{i=1}^r y_i + (n-r)y_r\) 定义式 工程意义:前r个失效样本的总试验时间 + 剩余\(n-r\)个未失效样本的总试验时间,是参数估计的核心统计量

表3 定理1.6.3 核心结论完整汇总

结论分类 核心公式与分布结论 教材公式编号 证明核心逻辑 关键意义
独立性结论 最小次序统计量 \(X_{(1)}\)\(S_1\)\(S\) 相互独立 定理核心结论 构造归一化间距变换后,\(X_{(1)}\) 仅与\(Z_1\)有关,\(S_1/S\)仅与\(Z_2,\dots,Z_r\)有关,而\(Z_1\)与其他\(Z_i\)独立 解决了双参数指数分布参数估计的独立性问题,可分别构造两个参数的估计量
最小次序统计量的分布 \(X_{(1)} \sim \mu + \Gamma\left( \frac{n}{\sigma}, 1 \right)\) (1.6.16) \(Z_1 = nX_{(1)} \sim n\mu + \Gamma(1/\sigma,1)\),做线性变换推导得到 \(X_{(1)}-\mu\) 服从尺度参数为\(\sigma/n\)的指数分布,是位置参数\(\mu\)的充分完备统计量
定数截尾总偏差\(S_1\)的分布 \(S_1 = T_{n,r} - nX_{(1)} \sim \Gamma\left( \frac{1}{\sigma}, r-1 \right)\) (1.6.14)(1.6.16) \(S_1 = Z_2+\dots+Z_r\),是\(r-1\)个独立同分布的\(\Gamma(1/\sigma,1)\)变量之和,由Gamma分布可加性推导 是尺度参数\(\sigma\)的核心估计量,可直接用于构造\(\sigma\)的置信区间与假设检验
全样本总偏差\(S\)的分布 \(S = \sum_{i=1}^n X_i - nX_{(1)} \sim \Gamma\left( \frac{1}{\sigma}, n-1 \right)\) (1.6.15)(1.6.16) \(r=n\)\(S_1=S\),代入\(S_1\)的分布结论直接得到 全样本试验下,尺度参数\(\sigma\)的核心估计量
标准指数分布特例(\(\mu=0\) 1. \(X_{(1)} \sim \Gamma\left( \frac{n}{\sigma}, 1 \right)\)
2. 联合密度简化为:\(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} \frac{1}{\sigma^r} \exp\left\{ -\frac{1}{\sigma} \left[ \sum_{i=1}^r y_i + (n-r)y_r \right] \right\} I\{y_1 \geqslant 0\} I\{y_1 < \dots < y_r\}\)
(1.6.17) \(\mu=0\),代入通用公式直接化简 单参数指数分布的核心公式,是最常用的工程简化形式
总试验时间\(T_{n,r}\)的分布(\(\mu=0\) \(T_{n,r} = Z_1+Z_2+\dots+Z_r \sim \Gamma\left( \frac{1}{\sigma}, r \right)\) (1.6.18)(1.6.19) \(\mu=0\)\(Z_1\sim\Gamma(1/\sigma,1)\),与\(Z_2,\dots,Z_r\)独立同分布,r个Gamma变量之和服从\(\Gamma(1/\sigma,r)\) 定数截尾试验下,总试验时间的分布完全已知,可用于试验方案设计

表4 定理证明核心变换与关键步骤汇总

变换环节 核心公式 关键计算结果 推导意义
归一化间距变换构造 \(\begin{cases} Z_1 = nX_{(1)} \\ Z_2 = (n-1)[X_{(2)}-X_{(1)}] \\ \quad \vdots \\ Z_r = (n-r+1)[X_{(r)}-X_{(r-1)}] \end{cases}\) 对相邻间距乘以剩余样本量做归一化 打破次序统计量的大小约束,为独立性推导做铺垫,是指数分布独有的经典变换
反变换(Z表示Y) \(\begin{cases} Y_1 = \frac{Z_1}{n} \\ Y_2 = \frac{Z_1}{n} + \frac{Z_2}{n-1} \\ \quad \vdots \\ Y_r = \frac{Z_1}{n} + \frac{Z_2}{n-1} + \dots + \frac{Z_r}{n-r+1} \end{cases}\) 雅可比矩阵为下三角矩阵,上三角部分全为0 建立Y与Z的一一映射,满足多元随机变量变换的条件
雅可比行列式计算 \(J = \frac{\partial(y_1,\dots,y_r)}{\partial(z_1,\dots,z_r)}\) \(J = \frac{1}{n} \cdot \frac{1}{n-1} \cdot \dots \cdot \frac{1}{n-r+1} = \frac{(n-r)!}{n!}\) 下三角矩阵的行列式等于对角线元素乘积,是多元密度变换的核心
核心恒等式 \(Z_1+Z_2+\dots+Z_r = \sum_{i=1}^r Y_i + (n-r)Y_r = T_{n,r}\) 归一化间距的和恰好等于总试验时间 大幅简化指数项的化简,直接建立变换与核心统计量的关联
Z的联合密度化简 \(f(z_1,\dots,z_r) = \left[ \frac{1}{\sigma} \mathrm{e}^{-\frac{1}{\sigma}(Z_1-n\mu)} I\{Z_1\geqslant n\mu\} \right] \cdot \prod_{i=2}^r \left[ \frac{1}{\sigma} \mathrm{e}^{-\frac{1}{\sigma}Z_i} I\{Z_i\geqslant0\} \right]\) 联合密度可完全分解为r个单变量密度的乘积 直接证明\(Z_1,\dots,Z_r\)相互独立,是定理结论的核心支撑
分布推导 1. \(Z_1 \sim n\mu + \Gamma(1/\sigma,1)\)
2. \(Z_2,\dots,Z_r \overset{i.i.d.}{\sim} \Gamma(1/\sigma,1)\)
每个\(Z_i\)的边缘分布均为指数分布 利用Gamma分布的可加性,直接推导\(S_1\)\(T_{n,r}\)的分布

表5 核心推论与分布性质对比

分类 核心结论 证明逻辑 本质解读
相邻间距的独立性 \(X_{(1)},\ X_{(2)}-X_{(1)},\ X_{(3)}-X_{(2)},\ \dots,\ X_{(n)}-X_{(n-1)}\) 相互独立 \(r=n\)时,\(Z_1,\dots,Z_n\)相互独立,而间距是\(Z_i\)的线性变换,因此保持独立性 指数分布无记忆性的直接体现:每次失效后,剩余样本的剩余寿命与全新样本一致,与之前的失效时间无关
次序统计量与剩余寿命的独立性 对任意\(i,k\)\(X_{(i)}\)\(X_{(i+k)}-X_{(i)}\) 相互独立 \(X_{(i)} = \sum_{j=1}^i W_j\)\(X_{(i+k)}-X_{(i)} = \sum_{j=i+1}^{i+k} W_j\),而\(W_j\)相互独立,因此二者独立 无记忆性的推广:第i个失效时间不影响后续的失效间隔时间,是生存分析中剩余寿命预测的理论基础
指数分布vs均匀分布 次序统计量性质核心对比 1. 指数分布:归一化间距独立同分布
2. 均匀分布:等间隔间距同分布但不独立
指数分布的无记忆性决定了间距独立;均匀分布的区间对称性决定了间距同分布,但大小约束导致不独立 两个分布的核心分界:
- 指数分布性质用于参数化可靠性与寿命分析
- 均匀分布性质用于非参数无分布检验

表6 工程应用场景与落地价值

应用场景 对应核心知识点 实际工程用途
定数截尾寿命试验参数估计 前r个次序统计量的联合密度、\(X_{(1)}\)\(S_1\)的分布与独立性 构造双参数指数分布中位置参数\(\mu\)、尺度参数\(\sigma\)的无偏估计、极大似然估计与置信区间
产品失效率假设检验 \(S_1\)的Gamma分布性质 检验产品的失效率是否达到设计要求,判断产品是否满足可靠性指标
加速寿命试验方案设计 总试验时间\(T_{n,r}\)的分布、次序统计量的间距性质 设计定数截尾加速寿命试验,缩短试验周期,评估产品的长期寿命与可靠性
产品剩余寿命预测 次序统计量与剩余寿命的独立性 基于已失效样本的观测数据,预测剩余未失效样本的剩余寿命,制定维护与更换策略
可靠性验证试验 最小次序统计量的分布 设计验证试验方案,验证产品的保证寿命\(\mu\)是否满足设计要求

posted on 2026-02-20 07:57  Indian_Mysore  阅读(1)  评论(0)    收藏  举报

导航