1.4.2非中心F分布与非中心t分布
非中心F分布与非中心t分布 详细讲解
这两类分布是非中心χ²分布的直接衍生,是线性模型、方差分析、协方差分析中,备择假设下F检验、t检验的核心分布工具,解决了中心F/t分布仅能处理原假设的局限,是假设检验功效分析的核心基础。
一、预备知识回顾
在正式讲解前,先明确3个核心基础分布的结论,避免推导断层:
- 中心F分布:若随机变量\(X_1 \sim \chi^2(n_1)\),\(X_2 \sim \chi^2(n_2)\),且\(X_1,X_2\)相互独立,则\[F = \frac{X_1/n_1}{X_2/n_2} \sim F(n_1,n_2) \]其中\(n_1\)为分子自由度,\(n_2\)为分母自由度;当\(n_2>2\)时,期望\(\mathbb{E}(F) = \frac{n_2}{n_2-2}\)。
- 中心t分布:若随机变量\(Y \sim N(0,1)\),\(Z \sim \chi^2(n)\),且\(Y,Z\)相互独立,则\[T = \frac{Y}{\sqrt{Z/n}} \sim t(n) \]其中\(n\)为自由度。
- 非中心χ²分布核心等价性:若\(X \sim \chi^2(n,\delta)\),则存在\(J \sim P(\delta/2)\),使得条件分布\(X|J=j \sim \chi^2(n+2j)\),这是推导非中心F分布所有性质的核心。
二、非中心F分布
1. 核心定义
定义:设随机变量\(X_1 \sim \chi^2(n_1,\delta)\)(非中心χ²分布,分子自由度\(n_1\),非中心参数\(\delta\)),\(X_2 \sim \chi^2(n_2)\)(中心χ²分布,分母自由度\(n_2\)),且\(X_1,X_2\)相互独立,则称随机变量
服从非中心F分布,记为\(X \sim F(n_1,n_2;\delta)\)。
定义拆解与核心说明
- 本质:非中心F分布是「非中心χ²分布除以自由度」与「中心χ²分布除以自由度」的比值,仅分子带有非中心参数\(\delta\),分母为中心χ²分布。
- 退化性:当非中心参数\(\delta=0\)时,分子\(X_1\)退化为中心χ²分布\(\chi^2(n_1)\),此时非中心F分布退化为中心F分布\(F(n_1,n_2)\),即\(F(n_1,n_2;0)=F(n_1,n_2)\)。
- 参数含义:
- \(n_1\):分子自由度(与分子χ²分布的自由度一致);
- \(n_2\):分母自由度(与分母χ²分布的自由度一致);
- \(\delta \geq 0\):非中心参数,完全继承自分子的非中心χ²分布,刻画分布对中心F分布的偏离程度,\(\delta\)越大,分布越向右偏移。
2. 核心性质与证明拆解
性质(1) 复合分布等价表示
若\(X \sim F(n_1,n_2;\delta)\),则\(X\)可视为联合分布\((X,J)\)中\(X\)的边缘分布,其中:
等价表述为:\(X|J=j \sim F(n_1+2j, n_2) \cdot \frac{n_1+2j}{n_1}\)。
证明逻辑拆解
这条性质的核心是继承非中心χ²分布的复合结构,推导过程完全基于非中心χ²的等价性:
- 由非中心χ²分布的性质,分子\(X_1 \sim \chi^2(n_1,\delta)\)可表示为:存在\(J \sim P(\delta/2)\),使得\(X_1|J=j \sim \chi^2(n_1+2j)\)。
- 给定\(J=j\)时,\(X\)的条件分布为:\[X|J=j = \frac{X_1/n_1}{X_2/n_2} \bigg| J=j = \frac{X_1/(n_1+2j)}{X_2/n_2} \cdot \frac{n_1+2j}{n_1} \bigg| J=j \]
- 此时\(X_1|J=j \sim \chi^2(n_1+2j)\),\(X_2 \sim \chi^2(n_2)\)且二者独立,因此\(\frac{X_1/(n_1+2j)}{X_2/n_2} \sim F(n_1+2j, n_2)\)。
- 代入后即得:\(X|J=j \sim F(n_1+2j, n_2) \cdot \frac{n_1+2j}{n_1}\),整理后即为性质结论。
核心价值
和非中心χ²的复合性质一致,这条性质把复杂的非中心F分布,转化为我们熟悉的「Poisson分布+条件中心F分布」的结构,是后续期望、分布函数推导的核心,也是非中心F分布随机数生成的核心方法。
性质(2) 数学期望
若\(X \sim F(n_1,n_2;\delta)\),且分母自由度\(n_2>2\),则
证明逻辑拆解
基于全期望公式+性质(1)的复合结构,结合中心F分布的期望结论推导:
- 全期望公式:\(\mathbb{E}(X) = \mathbb{E}_J\left[ \mathbb{E}(X|J) \right]\),先求给定\(J=j\)时\(X\)的条件期望。
- 由性质(1),\(X|J=j = \frac{n_1+2j}{n_1} \cdot F_j\),其中\(F_j \sim F(n_1+2j, n_2)\),因此条件期望为:\[\mathbb{E}(X|J=j) = \frac{n_1+2j}{n_1} \cdot \mathbb{E}(F_j) \]
- 中心F分布\(F(n_1+2j, n_2)\)的期望为\(\frac{n_2}{n_2-2}\)(\(n_2>2\)),代入得:\[\mathbb{E}(X|J=j) = \frac{n_1+2j}{n_1} \cdot \frac{n_2}{n_2-2} \]
- 对\(J\)求期望,\(J \sim P(\delta/2)\),因此\(\mathbb{E}(J)=\delta/2\),代入得:\[\mathbb{E}(X) = \mathbb{E}_J\left( \frac{n_1+2J}{n_1} \cdot \frac{n_2}{n_2-2} \right) = \frac{n_2}{n_2-2} \cdot \frac{n_1 + 2\mathbb{E}(J)}{n_1} \]
- 代入\(\mathbb{E}(J)=\delta/2\),化简后即得:\[\mathbb{E}(X) = \frac{n_1+\delta}{n_1} \cdot \frac{n_2}{n_2-2} \]
核心说明
- 非中心F分布的期望,是中心F分布期望\(\frac{n_2}{n_2-2}\)的\(\frac{n_1+\delta}{n_1}\)倍;
- 非中心参数\(\delta\)越大,期望越大,分布整体向右偏移,和直观认知一致;
- 当\(\delta=0\)时,期望退化为中心F分布的期望\(\frac{n_2}{n_2-2}\),再次验证退化性。
性质(3) 分布函数与概率密度函数
非中心F分布\(F(n_1,n_2;\delta)\)的分布函数为:
概率密度函数为:
其中\(F(\cdot; n_1+2j, n_2)\)和\(f(\cdot; n_1+2j, n_2)\)分别为中心F分布\(F(n_1+2j, n_2)\)的分布函数和概率密度函数。
证明逻辑拆解
-
分布函数证明:基于全概率公式+性质(1)的复合结构
- 分布函数定义:\(F(x; n_1,n_2,\delta) = P(X \leq x)\),由全概率公式,对离散随机变量\(J\)求和:\[P(X \leq x) = \sum_{j=0}^\infty P(J=j) P(X \leq x | J=j) \]
- 其中\(P(J=j) = e^{-\delta/2} \frac{(\delta/2)^j}{j!}\)(Poisson分布的概率质量);
- 由性质(1),\(P(X \leq x | J=j) = P\left( \frac{n_1}{n_1+2j} X \leq \frac{n_1}{n_1+2j} x \bigg| J=j \right)\),而\(\frac{n_1}{n_1+2j} X | J=j \sim F(n_1+2j, n_2)\),因此该概率即为中心F分布的分布函数\(F\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right)\);
- 代入后即得分布函数的表达式。
- 分布函数定义:\(F(x; n_1,n_2,\delta) = P(X \leq x)\),由全概率公式,对离散随机变量\(J\)求和:
-
密度函数证明:对分布函数求导
- 密度函数是分布函数的导数,即\(f(x) = F'(x)\);
- 对分布函数的无穷级数逐项求导(级数绝对收敛,可逐项求导),利用复合函数求导法则,对\(F\left( \frac{n_1}{n_1+2j} x; \cdot \right)\)求导后,会乘以导数项\(\frac{n_1}{n_1+2j}\),最终得到密度函数的表达式。
核心价值
这个性质给出了非中心F分布的显式表达式,本质是无穷多个中心F分布的Poisson加权和,和非中心Γ/χ²分布的定义完全一脉相承。实际计算中,我们可以通过截断无穷级数,用中心F分布的分布函数/密度函数,近似计算非中心F分布的对应值,无需单独推导复杂的积分公式。
三、非中心t分布
1. 核心定义
定义:设随机变量\(Y \sim N(\mu,1)\)(正态分布,均值\(\mu\),方差1),\(Z \sim \chi^2(n)\)(中心χ²分布,自由度\(n\)),且\(Y,Z\)相互独立,则称随机变量
服从非中心t分布,记为\(T \sim t(n,\delta)\),其中非中心参数\(\delta = \mu^2\)(部分教材定义\(\delta=\mu\),本质等价,仅参数缩放差异)。
定义拆解与核心说明
- 本质:非中心t分布是「非零均值的标准正态变量」与「中心χ²变量除以自由度的平方根」的比值,非中心性完全来自分子正态分布的非零均值。
- 退化性:当非中心参数\(\delta=0\)时,分子\(Y \sim N(0,1)\),此时非中心t分布退化为中心t分布\(t(n)\),即\(t(n,0)=t(n)\)。
- 参数含义:
- \(n\):自由度,继承自分母χ²分布的自由度;
- \(\delta \geq 0\):非中心参数,由分子正态分布的均值平方决定,刻画分布对中心t分布的偏离程度,\(\delta\)越大,分布的偏移越明显。
- 等价定义:若\(X \sim N(0,1)\),\(Z \sim \chi^2(n)\)独立,\(a\)为常数,则\(T = \frac{X+a}{\sqrt{Z/n}} \sim t(n, \delta=a^2)\),这个定义在假设检验中更常用(比如单样本t检验中,备择假设下均值非零,检验统计量就服从这个形式的非中心t分布)。
2. 核心性质
性质1:与非中心F分布的关系
若\(T \sim t(n,\delta)\),则\(T^2 \sim F(1, n; \delta)\),即非中心t分布变量的平方,服从分子自由度为1的非中心F分布,非中心参数完全一致。
证明逻辑
- 由定义,\(T = \frac{Y}{\sqrt{Z/n}}\),其中\(Y \sim N(\mu,1)\),\(Z \sim \chi^2(n)\)独立,因此\(T^2 = \frac{Y^2}{Z/n}\)。
- 由非中心χ²分布的性质,\(Y^2 \sim \chi^2(1, \delta=\mu^2)\),且\(Y^2\)与\(Z\)独立。
- 由非中心F分布的定义,\(\frac{Y^2/1}{Z/n} \sim F(1, n; \delta)\),因此\(T^2 \sim F(1, n; \delta)\),结论得证。
核心价值
这条性质搭建了非中心t分布和非中心F分布的桥梁,我们可以直接用非中心F分布的结论,推导非中心t分布的分布函数、数字特征,无需单独重复推导,大幅简化计算。
性质2:数字特征(补充)
基于中心t分布和复合结构,可推导非中心t分布的期望和方差(\(n>1\)时期望存在,\(n>2\)时方差存在):
- 期望:\(\mathbb{E}(T) = \mu \cdot \sqrt{\frac{n}{2}} \cdot \frac{\Gamma((n-1)/2)}{\Gamma(n/2)}\)(对应\(\delta=\mu^2\))
- 方差:\(\text{Var}(T) = \frac{n(1+\mu^2)}{n-2} - \left( \mu \cdot \sqrt{\frac{n}{2}} \cdot \frac{\Gamma((n-1)/2)}{\Gamma(n/2)} \right)^2\)
四、核心统计意义与应用场景
- 核心价值:中心F/t分布仅能处理「原假设成立时,检验统计量的分布」,而非中心F/t分布解决了「备择假设成立时,检验统计量的分布问题」,是假设检验功效分析的核心工具。
- 典型应用场景:
- 方差分析:备择假设下,组间平方和与组内平方和的比值服从非中心F分布,用于计算F检验的功效,确定实验所需的样本量;
- 线性回归:回归系数的t检验、整体显著性的F检验,备择假设下检验统计量服从非中心t/F分布,用于评估回归模型的检验效能;
- 两样本t检验、单样本t检验:备择假设下,t统计量服从非中心t分布,用于计算t检验的功效,设计实验的样本量。
- 原假设vs备择假设的分布差异:
- 原假设\(H_0\)成立时:正态变量均值为0,检验统计量服从中心F/t分布,用于计算临界值、p值;
- 备择假设\(H_1\)成立时:正态变量均值非0,检验统计量服从非中心F/t分布,用于计算检验功效(备择假设成立时拒绝原假设的概率)。
五、核心内容归纳表
表1 非中心F分布与非中心t分布 核心定义对照表
| 对比维度 | 非中心F分布 | 非中心t分布 | 关键备注 |
|---|---|---|---|
| 标准记号 | \(X \sim F(n_1, n_2; \delta)\) | \(T \sim t(n, \delta)\) | 均为非中心χ²分布的衍生分布 |
| 核心定义 | 设\(X_1 \sim \chi^2(n_1,\delta)\),\(X_2 \sim \chi^2(n_2)\)独立,则 \(X = \frac{X_1/n_1}{X_2/n_2}\) |
设\(Y \sim N(\mu,1)\),\(Z \sim \chi^2(n)\)独立,则 \(T = \frac{Y}{\sqrt{Z/n}}\),非中心参数\(\delta=\mu^2\) |
非中心性均来自分子的非中心分布/非零均值正态分布 |
| 核心参数 | 1. 分子自由度\(n_1>0\) 2. 分母自由度\(n_2>0\) 3. 非中心参数\(\delta \geq 0\) |
1. 自由度\(n>0\) 2. 非中心参数\(\delta \geq 0\) |
\(\delta=0\)时,均退化为对应的中心分布 |
| 与中心分布的退化关系 | \(F(n_1,n_2;0) = F(n_1,n_2)\)(标准中心F分布) | \(t(n,0) = t(n)\)(标准中心t分布) | 中心分布是非中心分布的特殊情况 |
| 两类分布的关联 | - | 若\(T \sim t(n,\delta)\),则\(T^2 \sim F(1,n;\delta)\) | 非中心t分布的平方是分子自由度为1的非中心F分布 |
表2 非中心F分布核心性质归纳表
| 性质分类 | 核心结论 | 核心说明 |
|---|---|---|
| 复合分布等价表示 | 存在\(J \sim P(\delta/2)\),使得$\frac{n_1}{n_1+2j}X | J=j \sim F(n_1+2j, n_2)$ |
| 数学期望(\(n_2>2\)) | \(\mathbb{E}(X) = \frac{n_1+\delta}{n_1} \cdot \frac{n_2}{n_2-2}\) | 是中心F分布期望的\(\frac{n_1+\delta}{n_1}\)倍,\(\delta\)越大,期望越大 |
| 分布函数 | \(F(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} F\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right)\) | 无穷多个中心F分布的Poisson加权和,可通过截断级数近似计算 |
| 概率密度函数 | \(f(x; n_1,n_2,\delta) = \sum_{j=0}^\infty e^{-\delta/2} \frac{(\delta/2)^j}{j!} f\left( \frac{n_1}{n_1+2j} x; n_1+2j, n_2 \right) \cdot \frac{n_1}{n_1+2j}\) | 由分布函数求导得到,同样为中心F分布的Poisson加权和 |
| 可加性拓展 | 若\(X_1 \sim F(n_1,n_2;\delta_1)\),\(X_2 \sim F(n_1,n_2;\delta_2)\)独立,无简单可加性;但分子非中心χ²可加,因此\(\frac{(X_{1a}+X_{1b})/n_1}{X_2/n_2} \sim F(n_1,n_2;\delta_1+\delta_2)\) | 可加性继承自分子非中心χ²分布的可加性 |
表3 核心统计应用对照表
| 分布类型 | 核心应用场景 | 原假设分布 | 备择假设分布 |
|---|---|---|---|
| 非中心F分布 | 方差分析F检验、线性模型整体显著性F检验、多组均值比较检验的功效分析与样本量计算 | 中心F分布\(F(n_1,n_2)\) | 非中心F分布\(F(n_1,n_2;\delta)\) |
| 非中心t分布 | 单样本t检验、两样本t检验、回归系数显著性t检验的功效分析与样本量计算 | 中心t分布\(t(n)\) | 非中心t分布\(t(n,\delta)\) |
posted on 2026-02-19 20:35 Indian_Mysore 阅读(2) 评论(0) 收藏 举报
浙公网安备 33010602011771号