昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.6.1次序统计量基本分布

次序统计量知识点深度讲解

各位同学,今天我们用一整段的时间,把次序统计量这个统计学核心知识点彻底讲透。我从事统计学教学与研究六十余年,这个知识点是参数统计与非参数统计的共同基础,既是概率论到数理统计的关键桥梁,也是后续极值理论、非参数检验、质量控制等方向的核心工具,我们从定义到推导、从直觉到应用,一步一步拆解,确保大家不仅会算公式,更懂背后的逻辑。


一、次序统计量的核心定义与前提约定

1. 什么是次序统计量

我们拿到一组独立同分布(i.i.d.)的样本 \(X_1,X_2,\dots,X_n\),这些样本是无序的——比如我们随机抽取5个学生的考试成绩,抽出来的顺序是随机的,没有大小约束。
次序统计量,就是把这组样本从小到大严格排序后得到的统计量,定义为:

\[X_{(1)} \leqslant X_{(2)} \leqslant \dots \leqslant X_{(n)} \]

也常记为 \(Y_1 \leqslant Y_2 \leqslant \dots \leqslant Y_n\),其中 \(Y_i = X_{(i)}\)

这里有三个必须先刻在脑子里的关键概念:

  • \(X_{(1)} = \min_{1\leqslant i\leqslant n}\{X_i\}\)最小次序统计量,也就是样本最小值
  • \(X_{(n)} = \max_{1\leqslant i\leqslant n}\{X_i\}\)最大次序统计量,也就是样本最大值
  • \(R = X_{(n)} - X_{(1)}\)极差,衡量样本的波动范围,是工业质量控制、描述性统计里最常用的统计量之一

⚠️ 第一个核心误区提醒:原样本 \(X_1,\dots,X_n\) 是独立同分布的,但次序统计量 \(X_{(1)},\dots,X_{(n)}\) 一定不独立——因为排序后天然存在约束 \(X_{(1)} \leqslant X_{(2)} \leqslant \dots \leqslant X_{(n)}\),前一个统计量的取值直接限制了后一个的取值范围,这是后续所有推导的基础。

2. 全章推导的核心前提约定

我们后续所有的分布推导,都基于两个严格前提,这两个前提不是可有可无的,是为了彻底简化问题、避免逻辑漏洞:

  1. 样本 \(X_1,\dots,X_n\)独立同分布(i.i.d.)的随机变量;
  2. 总体是绝对连续型分布,概率密度为 \(f(x)\),分布函数为 \(F(x)\)

为什么要限定绝对连续型?因为绝对连续型分布有一个关键性质:任意两个样本取值相等的概率为0,即 \(P(X_i = X_j)=0, i\neq j\)
这意味着我们可以认为排序后的次序统计量是严格递增的,即 \(P(X_{(1)} < X_{(2)} < \dots < X_{(n)}) = 1\),完全不用考虑“样本打结(多个样本取值相等)”的情况,所有“多个样本落在同一个无穷小微区间”的概率都是高阶无穷小,可以直接忽略,这是我们用“微元法”推导密度函数的核心基础。


二、单个次序统计量的分布(核心公式1.6.1)

我们先解决最基础的问题:第 \(i\) 个次序统计量 \(X_{(i)}\) 的概率密度函数是什么?

1. 先讲公式的直觉,再做严谨推导

先把核心公式写出来:

\[f_{(i)}(y) = \frac{n!}{(i-1)!(n-i)!} f(y) [F(y)]^{i-1} [1-F(y)]^{n-i} \tag{1.6.1} \]

很多同学背这个公式很痛苦,其实只要理解了它的概率意义,一辈子都忘不掉。我们要找的是“第 \(i\) 个次序统计量取值为 \(y\)”的密度,它等价于一个三项分布的概率问题

要让第 \(i\) 个次序统计量落在 \(y\) 附近,必须满足:

  1. \(n\) 个样本里,恰好有 \(i-1\) 个样本 \(\leqslant y\)
  2. 恰好有 \(1\) 个样本落在 \(y\) 附近的微小区间 \((y,y+dy]\)
  3. 剩下的 \(n-i\) 个样本全部 \(> y\)

这三个条件同时满足,才能让第 \(i\) 个次序统计量正好落在 \((y,y+dy]\) 里,没有其他可能(其他情况都是高阶无穷小,后面会证明)。

那这个事件的概率怎么算?

  • 组合数:把 \(n\) 个样本分成3组,第一组 \(i-1\) 个,第二组 \(1\) 个,第三组 \(n-i\) 个,分法总数是多项式组合数 \(\frac{n!}{(i-1)! \cdot 1! \cdot (n-i)!}\),也就是公式里的系数 \(\frac{n!}{(i-1)!(n-i)!}\)
  • 第一组的概率:一个样本 \(\leqslant y\) 的概率是 \(F(y)\)\(i-1\) 个就是 \([F(y)]^{i-1}\)
  • 第二组的概率:一个样本落在 \((y,y+dy]\) 的概率是 \(F(y+dy)-F(y) = f(y)dy + o(dy)\),当 \(dy\to0\) 时,近似为 \(f(y)dy\)
  • 第三组的概率:一个样本 \(>y\) 的概率是 \(1-F(y)\)\(n-i\) 个就是 \([1-F(y)]^{n-i}\)

把这些乘起来,就是这个事件的概率,再除以 \(dy\) 取极限,就得到了密度函数,这就是公式1.6.1的本质。

2. 严谨的数学证明

我们从概率密度的定义出发,对于连续型随机变量 \(Y_i=X_{(i)}\),有:

\[P\{y < Y_i \leqslant y+dy\} = F_{(i)}(y+dy) - F_{(i)}(y) = f_{(i)}(y)dy + o(dy) \]

其中 \(o(dy)\)\(dy\) 的高阶无穷小,即 \(\lim_{dy\to0} \frac{o(dy)}{dy}=0\)

接下来我们从次序统计量的定义出发,计算 \(P\{y < Y_i \leqslant y+dy\}\)
这个事件可以拆分为两部分:

  • \(P_1\)\(n\) 个样本中,有 \(i-1\)\(\leqslant y\),1个落在 \((y,y+dy]\),剩下 \(n-i\)\(> y+dy\)
  • \(P_2\):其他所有情况(比如有2个样本落在 \((y,y+dy]\)\(i-2\) 个样本 \(\leqslant y\) 且2个落在 \((y,y+dy]\) 等)。

我们先证明 \(P_2=o(dy)\):对于连续型分布,2个及以上样本落在长度为 \(dy\) 的区间里的概率,与 \((dy)^2\) 成正比,也就是 \(O((dy)^2)\),显然是 \(dy\) 的高阶无穷小,因此 \(P_2=o(dy)\),可以忽略。

接下来计算 \(P_1\),这是一个标准的多项分布概率:

\[P_1 = \frac{n!}{(i-1)! \cdot 1! \cdot (n-i)!} \cdot [F(y)]^{i-1} \cdot [f(y)dy] \cdot [1-F(y)]^{n-i} \]

因此我们有:

\[P\{y < Y_i \leqslant y+dy\} = P_1 + o(dy) = f_{(i)}(y)dy + o(dy) \]

两边同时除以 \(dy\),令 \(dy\to0\),高阶无穷小项趋于0,最终得到:

\[f_{(i)}(y) = \frac{n!}{(i-1)!(n-i)!} f(y) [F(y)]^{i-1} [1-F(y)]^{n-i} \]

推导完成,和我们的直觉完全一致。

3. 分布函数的Beta分布表示

教材里提到,\(X_{(i)}\) 的分布函数可以表示为正则化不完全Beta函数:

\[F_{(i)}(y) = I_{F(y)}(i, n-i+1) \]

这里给大家讲清楚这个结论的来源,不用死记硬背:
首先回忆Beta分布的定义:参数为 \(a,b\) 的Beta分布 \(Be(a,b)\),概率密度为:

\[f(x) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1}, \quad 0<x<1 \]

其中 \(B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}\),当 \(a,b\) 为正整数时,\(B(a,b)=\frac{(a-1)!(b-1)!}{(a+b-1)!}\)

我们对 \(f_{(i)}(y)\) 做变量替换,令 \(u=F(t)\),则 \(du=f(t)dt\),分布函数为:

\[F_{(i)}(y) = \int_{-\infty}^y f_{(i)}(t)dt = \int_{0}^{F(y)} \frac{n!}{(i-1)!(n-i)!} u^{i-1}(1-u)^{n-i} du \]

注意到 \(\frac{n!}{(i-1)!(n-i)!} = \frac{\Gamma(n+1)}{\Gamma(i)\Gamma(n-i+1)} = \frac{1}{B(i, n-i+1)}\),因此:

\[F_{(i)}(y) = \int_{0}^{F(y)} \frac{1}{B(i, n-i+1)} u^{i-1}(1-u)^{(n-i+1)-1} du \]

这正好就是正则化不完全Beta函数 \(I_{F(y)}(i, n-i+1)\) 的定义,这个结论的价值在于:Beta分布的数值有成熟的表格和计算工具,我们可以直接用它来计算次序统计量的分布概率,不用再做复杂积分。

4. 两个核心推论

推论1:最小值与最大值的密度函数

这是公式1.6.1的直接特例,也是最常用的两个结论:

  • \(i=1\) 时,就是最小次序统计量 \(X_{(1)}\),代入公式得:

    \[f_{(1)}(y) = n f(y) [1-F(y)]^{n-1} \tag{1.6.2} \]

    直觉:最小值落在 \(y\) 附近,等价于1个样本在 \(y\) 处,剩下 \(n-1\) 个样本都大于 \(y\),组合数 \(C_n^1=n\),和公式完全一致。

  • \(i=n\) 时,就是最大次序统计量 \(X_{(n)}\),代入公式得:

    \[f_{(n)}(y) = n f(y) [F(y)]^{n-1} \tag{1.6.3} \]

    直觉:最大值落在 \(y\) 附近,等价于1个样本在 \(y\) 处,剩下 \(n-1\) 个样本都小于等于 \(y\),组合数 \(C_n^1=n\),完全符合逻辑。

这里给大家一个验证方法:最大值的分布函数可以直接用独立性推导:

\[F_{(n)}(y) = P(X_{(n)} \leqslant y) = P(\text{所有}X_i \leqslant y) = [F(y)]^n \]

\(y\) 求导,正好得到 \(f_{(n)}(y)=n[F(y)]^{n-1}f(y)\),和我们的结论一致,验证了推导的正确性。

推论2:均匀分布的次序统计量服从Beta分布

如果总体服从 \((0,1)\) 上的均匀分布 \(R(0,1)\),则第 \(i\) 个次序统计量 \(X_{(i)} \sim Be(i, n-i+1)\),即:

\[X_{(i)} \sim BE(i, n-i+1) \tag{1.6.4} \]

这个结论是非参数统计的核心基石,推导非常直接:
均匀分布 \(R(0,1)\)\(0<y<1\) 时,\(f(y)=1\)\(F(y)=y\),代入公式1.6.1得:

\[f_{(i)}(y) = \frac{n!}{(i-1)!(n-i)!} y^{i-1} (1-y)^{n-i}, \quad 0<y<1 \]

这正好是Beta分布 \(Be(i, n-i+1)\) 的概率密度,推导完成。


三、两个次序统计量的联合分布

接下来我们进阶一步,研究两个次序统计量 \((X_{(i)}, X_{(j)})\)\(i<j\))的联合概率密度,这是推导极差、中位数、四分位距等统计量分布的基础。

1. 核心公式与直觉

联合密度公式为:

\[\begin{aligned} f(y,z) =& \frac{n!}{(i-1)!(j-i-1)!(n-j)!} f(y)f(z) [F(y)]^{i-1} \\ & \cdot [F(z)-F(y)]^{j-i-1} [1-F(z)]^{n-j} I\{y < z\} \end{aligned} \tag{1.6.5} \]

其中 \(I\{y<z\}\) 是指示函数,当 \(y<z\) 时取1,否则取0(因为 \(i<j\),所以必然有 \(X_{(i)} < X_{(j)}\))。

还是先讲直觉,这个公式本质是一个五项分布的概率问题

要让 \(X_{(i)}\) 落在 \((y,y+dy]\)\(X_{(j)}\) 落在 \((z,z+dz]\)\(y<z\)),必须满足:

  1. \(n\) 个样本里,恰好有 \(i-1\)\(\leqslant y\)
  2. 恰好有1个落在 \((y,y+dy]\)
  3. 恰好有 \(j-i-1\) 个落在 \((y, z]\)
  4. 恰好有1个落在 \((z,z+dz]\)
  5. 剩下的 \(n-j\) 个全部 \(> z\)

同样,其他情况(比如多个样本落在微小区间)都是高阶无穷小,可以忽略。

组合数就是把 \(n\) 个样本分成5组的多项式组合数:\(\frac{n!}{(i-1)! \cdot 1! \cdot (j-i-1)! \cdot 1! \cdot (n-j)!}\),也就是公式里的系数,和我们的直觉完全对应。

2. 严谨证明

从联合密度的定义出发,对于二维连续型随机变量,有:

\[P\{y<X_{(i)}\leqslant y+dy, z<X_{(j)}\leqslant z+dz\} = f(y,z) dydz + o(\rho) \]

其中 \(\rho=\sqrt{dy^2+dz^2}\)\(o(\rho)\)\(\rho\) 的高阶无穷小。

和单个次序统计量的推导逻辑一致,这个事件的主项是“每个微小区间恰好有1个样本”的情况,其他情况都是 \(o(\rho)\),可以忽略。

主项 \(P_1\) 的多项式概率为:

\[P_1 = \frac{n!}{(i-1)!(j-i-1)!(n-j)!} \cdot [F(y)]^{i-1} \cdot [f(y)dy] \cdot [F(z)-F(y)]^{j-i-1} \cdot [f(z)dz] \cdot [1-F(z)]^{n-j} \]

两边除以 \(dydz\),令 \(\rho\to0\),高阶无穷小项趋于0,最终得到公式1.6.5,推导完成。

3. 两个核心推论

推论1:最小值与最大值的联合密度

这是公式1.6.5的特例,取 \(i=1, j=n\),代入得:

\[f(y,z) = n(n-1) f(y)f(z) [F(z)-F(y)]^{n-2} I\{y < z\} \tag{1.6.6} \]

直觉非常好理解:最小值在 \(y\)、最大值在 \(z\),等价于1个样本在 \(y\)、1个样本在 \(z\),剩下 \(n-2\) 个样本全部落在 \((y,z)\) 之间,组合数 \(C_n^1 \cdot C_{n-1}^1 = n(n-1)\),和公式完全一致。

推论2:极差的分布

极差 \(R=X_{(n)}-X_{(1)}\),也就是最大值减最小值,是衡量样本波动的核心统计量,它的概率密度为:

\[h(r) = n(n-1) \int_{-\infty}^{\infty} f(t)f(t+r) [F(t+r)-F(t)]^{n-2} dt, \quad r>0 \tag{1.6.7} \]

这个公式的推导,用的是二维随机变量函数的雅可比变换法,步骤非常清晰:

  1. 做变量替换:令 \(R = Z-Y\)\(T=Y\),其中 \(Y=X_{(1)}, Z=X_{(n)}\),反解得到 \(Y=T\)\(Z=T+R\)
  2. 计算雅可比行列式:

    \[J = \frac{\partial(Y,Z)}{\partial(T,R)} = \begin{vmatrix} \frac{\partial Y}{\partial T} & \frac{\partial Y}{\partial R} \\ \frac{\partial Z}{\partial T} & \frac{\partial Z}{\partial R} \end{vmatrix} = \begin{vmatrix} 1 & 0 \\ 1 & 1 \end{vmatrix} = 1 \]

    雅可比行列式的绝对值 \(|J|=1\)
  3. 代入联合密度公式,得到 \((T,R)\) 的联合密度:

    \[f_{T,R}(t,r) = f_{Y,Z}(t, t+r) \cdot |J| = n(n-1) f(t)f(t+r) [F(t+r)-F(t)]^{n-2}, \quad r>0 \]

  4. \(t\) 积分求 \(R\) 的边缘密度,就得到了公式1.6.7,推导完成。

举个常用的例子:如果总体是 \(R(0,1)\) 均匀分布,代入公式可得极差 \(R \sim Be(n-1, 2)\),大家可以自己推导验证,这个结论在非参数统计里经常用到。


四、多个次序统计量的联合分布

最后我们推广到更一般的情况:前 \(r\) 个次序统计量的联合分布,以及所有次序统计量的联合分布。

1. 前 \(r\) 个次序统计量的联合密度

\(r\) 个次序统计量 \(X_{(1)},\dots,X_{(r)}\) 的联合密度为:

\[f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} f(y_1)\cdots f(y_r) [1-F(y_r)]^{n-r} I\{y_1 < \dots < y_r\} \tag{1.6.8} \]

还是先讲直觉:要让前 \(r\) 个次序统计量分别落在 \(r\) 个微小区间里,等价于 \(r\) 个样本分别落在这 \(r\) 个区间(每个区间1个),剩下的 \(n-r\) 个样本全部大于 \(y_r\)
组合数是从 \(n\) 个样本里有序选 \(r\) 个的排列数 \(P_n^r = \frac{n!}{(n-r)!}\),和公式里的系数完全对应,推导逻辑和前面完全一致,这里不再重复展开。

2. 所有次序统计量的联合密度

\(r=n\) 时,就得到了所有次序统计量的联合密度:

\[f(y_1,\dots,y_n) = n! f(y_1)\cdots f(y_n) I\{y_1 < y_2 < \dots < y_n\} \tag{1.6.9} \]

这个结论是整个次序统计量理论的“终极结论”,直觉非常深刻:
原样本 \(X_1,\dots,X_n\) 的联合密度是 \(f(x_1)f(x_2)\cdots f(x_n)\)(独立同分布),而对于任意一组严格递增的 \(y_1<\dots<y_n\),有 \(n!\) 种原样本的排列方式,排序后都能得到这组次序统计量,因此次序统计量的联合密度就是原联合密度乘以 \(n!\),完美符合公式。

最经典的特例:\((0,1)\) 均匀分布的所有次序统计量,联合密度为 \(f(y_1,\dots,y_n)=n!\)\(0<y_1<\dots<y_n<1\),这就是 \(n\) 维单纯形上的均匀分布,是非参数秩检验的核心基础。


五、总结与应用价值

最后,我们把整个知识点的核心逻辑串起来,给大家梳理清楚它的应用价值:

  1. 核心逻辑:所有次序统计量的分布推导,本质都是微元法+多项分布——把次序统计量落在微小区间的概率,转化为原样本在不同区间的计数概率,忽略高阶无穷小后得到密度函数,所有公式都可以用这个逻辑推导,不用死记硬背。
  2. 核心记忆点
    • 单个次序统计量:3个区间,多项式组合数 \(\frac{n!}{(i-1)!(n-i)!}\)
    • 两个次序统计量:5个区间,多项式组合数 \(\frac{n!}{(i-1)!(j-i-1)!(n-j)!}\)
    • 全次序统计量:\(n!\) 种排列,系数为 \(n!\)
  3. 应用价值
    • 参数统计:极值理论(洪水、地震、金融风险预测)、寿命数据分析,都基于最大/最小次序统计量的分布;
    • 非参数统计:符号检验、秩和检验、游程检验等经典方法,全部基于均匀分布次序统计量的Beta分布性质;
    • 应用统计:质量控制的极差控制图、描述性统计的中位数/四分位数/百分位数,都是次序统计量的直接应用。

这个知识点是统计学的“基本功”,只有把它的逻辑彻底吃透,后续的数理统计内容才能学扎实,不会出现“知其然不知其所以然”的问题。

次序统计量知识点全归纳表格汇总

以下表格严格对应教材公式与推导逻辑,从基础定义、核心分布、高频推论到应用映射,完整覆盖全知识点,可直接用于学习、备课与公式速查。


表1 基础定义与核心前提约定

分类 核心内容 关键说明与备注
次序统计量定义 对独立同分布(i.i.d.)样本 \(X_1,X_2,\dots,X_n\) 从小到大排序,记为 \(X_{(1)} \leqslant X_{(2)} \leqslant \dots \leqslant X_{(n)}\),其中 \(X_{(i)}\) 称为\(i\) 个次序统计量 原样本独立同分布,但次序统计量不独立,存在天然的大小约束关系
核心衍生统计量 1. 最小次序统计量:\(X_{(1)} = \min_{1\leqslant i\leqslant n} \{X_i\}\)
2. 最大次序统计量:\(X_{(n)} = \max_{1\leqslant i\leqslant n} \{X_i\}\)
3. 极差:\(R = X_{(n)} - X_{(1)}\)
极差是衡量样本离散程度的最简统计量,广泛用于工业质量控制、描述性统计
全量推导核心前提 1. 样本 \(X_1,\dots,X_n\) 为i.i.d.样本
2. 总体为绝对连续型分布,概率密度为 \(f(x)\),分布函数为 \(F(x)\)
绝对连续型保证 \(P(X_i=X_j)=0\ (i≠j)\),即 \(P(X_{(1)}<X_{(2)}<\dots<X_{(n)})=1\),可忽略样本打结与高阶无穷小项

表2 核心概率密度函数(PDF)汇总

统计量类型 概率密度函数公式 教材公式编号 核心适用条件 概率本质含义
单个第 \(i\) 个次序统计量 \(X_{(i)}\) \(f_{(i)}(y) = \frac{n!}{(i-1)!(n-i)!} f(y) [F(y)]^{i-1} [1-F(y)]^{n-i}\) (1.6.1) \(1\leqslant i\leqslant n\),满足表1的核心前提 等价于三项分布:\(i-1\) 个样本 \(\leqslant y\),1个样本落在 \(y\) 附近微小区间,\(n-i\) 个样本 \(>y\)
两个次序统计量 \((X_{(i)},X_{(j)})\ (i<j)\) \(\begin{aligned}f(y,z) =& \frac{n!}{(i-1)!(j-i-1)!(n-j)!} f(y)f(z) [F(y)]^{i-1} \\ &\cdot [F(z)-F(y)]^{j-i-1} [1-F(z)]^{n-j} I\{y<z\}\end{aligned}\) (1.6.5) \(1\leqslant i<j\leqslant n\),满足表1的核心前提 等价于五项分布:\(i-1\)\(\leqslant y\),1个在 \(y\) 附近,\(j-i-1\) 个在 \((y,z)\) 区间,1个在 \(z\) 附近,\(n-j\)\(>z\)
\(r\) 个次序统计量 \(X_{(1)},\dots,X_{(r)}\) \(f(y_1,\dots,y_r) = \frac{n!}{(n-r)!} f(y_1)\cdots f(y_r) [1-F(y_r)]^{n-r} I\{y_1<\dots<y_r\}\) (1.6.8) \(1\leqslant r\leqslant n\),满足表1的核心前提 等价于:\(r\) 个样本分别落在 \(r\) 个微小区间,剩余 \(n-r\) 个样本全部 \(>y_r\)
全次序统计量 \(X_{(1)},\dots,X_{(n)}\) \(f(y_1,\dots,y_n) = n! f(y_1)\cdots f(y_n) I\{y_1<y_2<\dots<y_n\}\) (1.6.9) 满足表1的核心前提 原样本的 \(n!\) 种排列排序后对应同一组次序统计量,联合密度为原样本联合密度乘以排列数 \(n!\)

表3 高频推论与应用公式汇总

推论名称 公式内容 教材公式编号 核心适用场景 备注说明
最小次序统计量的PDF \(f_{(1)}(y) = n f(y) [1-F(y)]^{n-1}\) (1.6.2) 样本最小值分布、寿命数据分析、极值下限预测 单个次序统计量公式取 \(i=1\) 的特例,组合数为 \(C_n^1=n\)
最大次序统计量的PDF \(f_{(n)}(y) = n f(y) [F(y)]^{n-1}\) (1.6.3) 样本最大值分布、极值理论、金融/自然灾害风险预测 单个次序统计量公式取 \(i=n\) 的特例,可通过分布函数 \(F_{(n)}(y)=[F(y)]^n\) 求导验证
最小/最大次序统计量的联合PDF \(f(y,z) = n(n-1) f(y)f(z) [F(z)-F(y)]^{n-2} I\{y<z\}\) (1.6.6) 极值联合分布、极差/极值比分布推导 两个次序统计量公式取 \(i=1,j=n\) 的特例,组合数为 \(n(n-1)\)
极差 \(R=X_{(n)}-X_{(1)}\) 的PDF \(h(r) = n(n-1) \int_{-\infty}^{\infty} f(t)f(t+r) [F(t+r)-F(t)]^{n-2} dt, \quad r>0\) (1.6.7) 样本极差分布、质量控制图、离散程度统计推断 通过雅可比变换 \(R=Z-Y,T=Y\) 对极值联合密度积分得到,雅可比行列式 \(|J|=1\)
(0,1)均匀分布的次序统计量分布 \(X_1\sim R(0,1)\),则 \(X_{(i)} \sim Be(i, n-i+1)\)(Beta分布) (1.6.4) 非参数秩检验、百分位数推断、无分布统计推断 均匀分布下 \(f(y)=1,F(y)=y\),代入单个次序统计量公式恰好匹配Beta分布的PDF

表4 分布函数与概率分布映射关系

统计量 分布函数表达式 对应分布关系 核心应用价值
\(i\) 个次序统计量 \(X_{(i)}\) \(F_{(i)}(y) = I_{F(y)}(i, n-i+1)\) 正则化不完全Beta函数 可直接通过Beta分布表/数值工具计算累积概率,无需复杂积分
(0,1)均匀分布第 \(i\) 个次序统计量 \(X_{(i)}\) \(F_{(i)}(y) = I_y(i, n-i+1)\) 严格服从 \(Be(i, n-i+1)\) 分布 非参数统计的核心理论基础,无需总体分布信息即可完成统计推断
最大次序统计量 \(X_{(n)}\) \(F_{(n)}(y) = [F(y)]^n\) i.i.d.随机变量最大值通用分布 百年一遇灾害、极端风险事件的概率计算
最小次序统计量 \(X_{(1)}\) \(F_{(1)}(y) = 1 - [1-F(y)]^n\) i.i.d.随机变量最小值通用分布 产品可靠性分析、寿命数据统计的核心公式

posted on 2026-02-20 07:42  Indian_Mysore  阅读(0)  评论(0)    收藏  举报

导航