昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.4.2非中心F分布与非中心t分布

非中心F分布与非中心t分布 详细讲解

这两类分布是非中心χ²分布的直接衍生,是线性模型、方差分析、协方差分析中,备择假设下F检验、t检验的核心分布工具,解决了中心F/t分布仅能处理原假设的局限,是假设检验功效分析的核心基础。


一、预备知识回顾

在正式讲解前,先明确3个核心基础分布的结论,避免推导断层:

  1. 中心F分布:若随机变量\(X_1 \sim \chi^2(n_1)\)\(X_2 \sim \chi^2(n_2)\),且\(X_1,X_2\)相互独立,则

    \[F = \frac{X_1/n_1}{X_2/n_2} \sim F(n_1,n_2) \]

    其中\(n_1\)为分子自由度,\(n_2\)为分母自由度;当\(n_2>2\)时,期望\(\mathbb{E}(F) = \frac{n_2}{n_2-2}\)
  2. 中心t分布:若随机变量\(Y \sim N(0,1)\)\(Z \sim \chi^2(n)\),且\(Y,Z\)相互独立,则

    \[T = \frac{Y}{\sqrt{Z/n}} \sim t(n) \]

    其中\(n\)为自由度。
  3. 非中心χ²分布核心等价性:若\(X \sim \chi^2(n,\delta)\),则存在\(J \sim P(\delta/2)\),使得条件分布\(X|J=j \sim \chi^2(n+2j)\),这是推导非中心F分布所有性质的核心。

二、非中心F分布

1. 核心定义

定义:设随机变量\(X_1 \sim \chi^2(n_1,\delta)\)(非中心χ²分布,分子自由度\(n_1\),非中心参数\(\delta\)),\(X_2 \sim \chi^2(n_2)\)(中心χ²分布,分母自由度\(n_2\)),且\(X_1,X_2\)相互独立,则称随机变量

\[X = \frac{X_1/n_1}{X_2/n_2} \]

服从非中心F分布,记为\(X \sim F(n_1,n_2;\delta)\)

定义拆解与核心说明

  • 本质:非中心F分布是「非中心χ²分布除以自由度」与「中心χ²分布除以自由度」的比值,仅分子带有非中心参数\(\delta\),分母为中心χ²分布。
  • 退化性:当非中心参数\(\delta=0\)时,分子\(X_1\)退化为中心χ²分布\(\chi^2(n_1)\),此时非中心F分布退化为中心F分布\(F(n_1,n_2)\),即\(F(n_1,n_2;0)=F(n_1,n_2)\)
  • 参数含义
    • \(n_1\):分子自由度(与分子χ²分布的自由度一致);
    • \(n_2\):分母自由度(与分母χ²分布的自由度一致);
    • \(\delta \geq 0\):非中心参数,完全继承自分子的非中心χ²分布,刻画分布对中心F分布的偏离程度,\(\delta\)越大,分布越向右偏移。

2. 核心性质与证明拆解

性质(1) 复合分布等价表示

\(X \sim F(n_1,n_2;\delta)\),则\(X\)可视为联合分布\((X,J)\)\(X\)的边缘分布,其中:

\[J \sim P(\delta/2), \quad \frac{n_1}{n_1+2j} X \bigg| J=j \sim F(n_1+2j, n_2) \]

等价表述为:\(X|J=j \sim F(n_1+2j, n_2) \cdot \frac{n_1+2j}{n_1}\)

证明逻辑拆解

这条性质的核心是继承非中心χ²分布的复合结构,推导过程完全基于非中心χ²的等价性:

  1. 由非中心χ²分布的性质,分子\(X_1 \sim \chi^2(n_1,\delta)\)可表示为:存在\(J \sim P(\delta/2)\),使得\(X_1|J=j \sim \chi^2(n_1+2j)\)
  2. 给定\(J=j\)时,\(X\)的条件分布为:

    \[X|J=j = \frac{X_1/n_1}{X_2/n_2} \bigg| J=j = \frac{X_1/(n_1+2j)}{X_2/n_2} \cdot \frac{n_1+2j}{n_1} \bigg| J=j \]

  3. 此时\(X_1|J=j \sim \chi^2(n_1+2j)\)\(X_2 \sim \chi^2(n_2)\)且二者独立,因此\(\frac{X_1/(n_1+2j)}{X_2/n_2} \sim F(n_1+2j, n_2)\)
  4. 代入后即得:\(X|J=j \sim F(n_1+2j, n_2) \cdot \frac{n_1+2j}{n_1}\),整理后即为性质结论。
核心价值

和非中心χ²的复合性质一致,这条性质把复杂的非中心F分布,转化为我们熟悉的「Poisson分布+条件中心F分布」的结构,是后续期望、分布函数推导的核心,也是非中心F分布随机数生成的核心方法。


性质(2) 数学期望

\(X \sim F(n_1,n_2;\delta)\),且分母自由度\(n_2>2\),则

\[\mathbb{E}(X) = \frac{n_1+\delta}{n_1} \cdot \frac{n_2}{n_2-2} \]

证明逻辑拆解

基于全期望公式+性质(1)的复合结构,结合中心F分布的期望结论推导:

  1. 全期望公式:\(\mathbb{E}(X) = \mathbb{E}_J\left[ \mathbb{E}(X|J) \right]\),先求给定\(J=j\)\(X\)的条件期望。
  2. 由性质(1),\(X|J=j = \frac{n_1+2j}{n_1} \cdot F_j\),其中\(F_j \sim F(n_1+2j, n_2)\),因此条件期望为:

    \[\mathbb{E}(X|J=j) = \frac{n_1+2j}{n_1} \cdot \mathbb{E}(F_j) \]

  3. 中心F分布\(F(n_1+2j, n_2)\)的期望为\(\frac{n_2}{n_2-2}\)\(n_2>2\)),代入得:

    \[\mathbb{E}(X|J=j) = \frac{n_1+2j}{n_1} \cdot \frac{n_2}{n_2-2} \]

  4. \(J\)求期望,\(J \sim P(\delta/2)\),因此\(\mathbb{E}(J)=\delta/2\),代入得:

    \[\mathbb{E}(X) = \mathbb{E}_J\left( \frac{n_1+2J}{n_1} \cdot \frac{n_2}{n_2-2} \right) = \frac{n_2}{n_2-2} \cdot \frac{n_1 + 2\mathbb{E}(J)}{n_1} \]

  5. 代入\(\mathbb{E}(J)=\delta/2\),化简后即得:

    \[\mathbb{E}(X) = \frac{n_1+\delta}{n_1} \cdot \frac{n_2}{n_2-2} \]

核心说明
  • 非中心F分布的期望,是中心F分布期望\(\frac{n_2}{n_2-2}\)\(\frac{n_1+\delta}{n_1}\)倍;
  • 非中心参数\(\delta\)越大,期望越大,分布整体向右偏移,和直观认知一致;
  • \(\delta=0\)时,期望退化为中心F分布的期望\(\frac{n_2}{n_2-2}\),再次验证退化性。

性质(3) 分布函数与概率密度函数

非中心F分布\(F(n_1,n_2;\delta)\)的分布函数为:

\[F(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} F\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right) \]

概率密度函数为:

\[f(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} f\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right) \cdot \frac{n_1}{n_1+2j} \]

其中\(F(\cdot; n_1+2j, n_2)\)\(f(\cdot; n_1+2j, n_2)\)分别为中心F分布\(F(n_1+2j, n_2)\)的分布函数和概率密度函数。

证明逻辑拆解
  1. 分布函数证明:基于全概率公式+性质(1)的复合结构

    • 分布函数定义:\(F(x; n_1,n_2,\delta) = P(X \leq x)\),由全概率公式,对离散随机变量\(J\)求和:

      \[P(X \leq x) = \sum_{j=0}^\infty P(J=j) P(X \leq x | J=j) \]

    • 其中\(P(J=j) = e^{-\delta/2} \frac{(\delta/2)^j}{j!}\)(Poisson分布的概率质量);
    • 由性质(1),\(P(X \leq x | J=j) = P\left( \frac{n_1}{n_1+2j} X \leq \frac{n_1}{n_1+2j} x \bigg| J=j \right)\),而\(\frac{n_1}{n_1+2j} X | J=j \sim F(n_1+2j, n_2)\),因此该概率即为中心F分布的分布函数\(F\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right)\)
    • 代入后即得分布函数的表达式。
  2. 密度函数证明:对分布函数求导

    • 密度函数是分布函数的导数,即\(f(x) = F'(x)\)
    • 对分布函数的无穷级数逐项求导(级数绝对收敛,可逐项求导),利用复合函数求导法则,对\(F\left( \frac{n_1}{n_1+2j} x; \cdot \right)\)求导后,会乘以导数项\(\frac{n_1}{n_1+2j}\),最终得到密度函数的表达式。
核心价值

这个性质给出了非中心F分布的显式表达式,本质是无穷多个中心F分布的Poisson加权和,和非中心Γ/χ²分布的定义完全一脉相承。实际计算中,我们可以通过截断无穷级数,用中心F分布的分布函数/密度函数,近似计算非中心F分布的对应值,无需单独推导复杂的积分公式。


三、非中心t分布

1. 核心定义

定义:设随机变量\(Y \sim N(\mu,1)\)(正态分布,均值\(\mu\),方差1),\(Z \sim \chi^2(n)\)(中心χ²分布,自由度\(n\)),且\(Y,Z\)相互独立,则称随机变量

\[T = \frac{Y}{\sqrt{Z/n}} \]

服从非中心t分布,记为\(T \sim t(n,\delta)\),其中非中心参数\(\delta = \mu^2\)(部分教材定义\(\delta=\mu\),本质等价,仅参数缩放差异)。

定义拆解与核心说明

  • 本质:非中心t分布是「非零均值的标准正态变量」与「中心χ²变量除以自由度的平方根」的比值,非中心性完全来自分子正态分布的非零均值。
  • 退化性:当非中心参数\(\delta=0\)时,分子\(Y \sim N(0,1)\),此时非中心t分布退化为中心t分布\(t(n)\),即\(t(n,0)=t(n)\)
  • 参数含义
    • \(n\):自由度,继承自分母χ²分布的自由度;
    • \(\delta \geq 0\):非中心参数,由分子正态分布的均值平方决定,刻画分布对中心t分布的偏离程度,\(\delta\)越大,分布的偏移越明显。
  • 等价定义:若\(X \sim N(0,1)\)\(Z \sim \chi^2(n)\)独立,\(a\)为常数,则\(T = \frac{X+a}{\sqrt{Z/n}} \sim t(n, \delta=a^2)\),这个定义在假设检验中更常用(比如单样本t检验中,备择假设下均值非零,检验统计量就服从这个形式的非中心t分布)。

2. 核心性质

性质1:与非中心F分布的关系

\(T \sim t(n,\delta)\),则\(T^2 \sim F(1, n; \delta)\),即非中心t分布变量的平方,服从分子自由度为1的非中心F分布,非中心参数完全一致。

证明逻辑
  1. 由定义,\(T = \frac{Y}{\sqrt{Z/n}}\),其中\(Y \sim N(\mu,1)\)\(Z \sim \chi^2(n)\)独立,因此\(T^2 = \frac{Y^2}{Z/n}\)
  2. 由非中心χ²分布的性质,\(Y^2 \sim \chi^2(1, \delta=\mu^2)\),且\(Y^2\)\(Z\)独立。
  3. 由非中心F分布的定义,\(\frac{Y^2/1}{Z/n} \sim F(1, n; \delta)\),因此\(T^2 \sim F(1, n; \delta)\),结论得证。
核心价值

这条性质搭建了非中心t分布和非中心F分布的桥梁,我们可以直接用非中心F分布的结论,推导非中心t分布的分布函数、数字特征,无需单独重复推导,大幅简化计算。

性质2:数字特征(补充)

基于中心t分布和复合结构,可推导非中心t分布的期望和方差(\(n>1\)时期望存在,\(n>2\)时方差存在):

  • 期望:\(\mathbb{E}(T) = \mu \cdot \sqrt{\frac{n}{2}} \cdot \frac{\Gamma((n-1)/2)}{\Gamma(n/2)}\)(对应\(\delta=\mu^2\)
  • 方差:\(\text{Var}(T) = \frac{n(1+\mu^2)}{n-2} - \left( \mu \cdot \sqrt{\frac{n}{2}} \cdot \frac{\Gamma((n-1)/2)}{\Gamma(n/2)} \right)^2\)

四、核心统计意义与应用场景

  1. 核心价值:中心F/t分布仅能处理「原假设成立时,检验统计量的分布」,而非中心F/t分布解决了「备择假设成立时,检验统计量的分布问题」,是假设检验功效分析的核心工具。
  2. 典型应用场景
    • 方差分析:备择假设下,组间平方和与组内平方和的比值服从非中心F分布,用于计算F检验的功效,确定实验所需的样本量;
    • 线性回归:回归系数的t检验、整体显著性的F检验,备择假设下检验统计量服从非中心t/F分布,用于评估回归模型的检验效能;
    • 两样本t检验、单样本t检验:备择假设下,t统计量服从非中心t分布,用于计算t检验的功效,设计实验的样本量。
  3. 原假设vs备择假设的分布差异
    • 原假设\(H_0\)成立时:正态变量均值为0,检验统计量服从中心F/t分布,用于计算临界值、p值;
    • 备择假设\(H_1\)成立时:正态变量均值非0,检验统计量服从非中心F/t分布,用于计算检验功效(备择假设成立时拒绝原假设的概率)。

五、核心内容归纳表

表1 非中心F分布与非中心t分布 核心定义对照表

对比维度 非中心F分布 非中心t分布 关键备注
标准记号 \(X \sim F(n_1, n_2; \delta)\) \(T \sim t(n, \delta)\) 均为非中心χ²分布的衍生分布
核心定义 \(X_1 \sim \chi^2(n_1,\delta)\)\(X_2 \sim \chi^2(n_2)\)独立,则
\(X = \frac{X_1/n_1}{X_2/n_2}\)
\(Y \sim N(\mu,1)\)\(Z \sim \chi^2(n)\)独立,则
\(T = \frac{Y}{\sqrt{Z/n}}\),非中心参数\(\delta=\mu^2\)
非中心性均来自分子的非中心分布/非零均值正态分布
核心参数 1. 分子自由度\(n_1>0\)
2. 分母自由度\(n_2>0\)
3. 非中心参数\(\delta \geq 0\)
1. 自由度\(n>0\)
2. 非中心参数\(\delta \geq 0\)
\(\delta=0\)时,均退化为对应的中心分布
与中心分布的退化关系 \(F(n_1,n_2;0) = F(n_1,n_2)\)(标准中心F分布) \(t(n,0) = t(n)\)(标准中心t分布) 中心分布是非中心分布的特殊情况
两类分布的关联 - \(T \sim t(n,\delta)\),则\(T^2 \sim F(1,n;\delta)\) 非中心t分布的平方是分子自由度为1的非中心F分布

表2 非中心F分布核心性质归纳表

性质分类 核心结论 核心说明
复合分布等价表示 存在\(J \sim P(\delta/2)\),使得$\frac{n_1}{n_1+2j}X J=j \sim F(n_1+2j, n_2)$
数学期望(\(n_2>2\) \(\mathbb{E}(X) = \frac{n_1+\delta}{n_1} \cdot \frac{n_2}{n_2-2}\) 是中心F分布期望的\(\frac{n_1+\delta}{n_1}\)倍,\(\delta\)越大,期望越大
分布函数 \(F(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} F\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right)\) 无穷多个中心F分布的Poisson加权和,可通过截断级数近似计算
概率密度函数 \(f(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} f\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right) \cdot \frac{n_1}{n_1+2j}\) 由分布函数求导得到,同样为中心F分布的Poisson加权和
可加性拓展 \(X_1 \sim F(n_1,n_2;\delta_1)\)\(X_2 \sim F(n_1,n_2;\delta_2)\)独立,无简单可加性;但分子非中心χ²可加,因此\(\frac{(X_{1a}+X_{1b})/n_1}{X_2/n_2} \sim F(n_1,n_2;\delta_1+\delta_2)\) 可加性继承自分子非中心χ²分布的可加性

表3 核心统计应用对照表

分布类型 核心应用场景 原假设分布 备择假设分布
非中心F分布 方差分析F检验、线性模型整体显著性F检验、多组均值比较检验的功效分析与样本量计算 中心F分布\(F(n_1,n_2)\) 非中心F分布\(F(n_1,n_2;\delta)\)
非中心t分布 单样本t检验、两样本t检验、回归系数显著性t检验的功效分析与样本量计算 中心t分布\(t(n)\) 非中心t分布\(t(n,\delta)\)

posted on 2026-02-19 20:35  Indian_Mysore  阅读(2)  评论(0)    收藏  举报

导航