昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.5.1指数族分布基本定义

指数族分布 深度系统讲解

各位同学,今天我们用60余年数理统计研究与教学的沉淀,把指数族分布这个统计学、机器学习、贝叶斯推断的核心基石,从定义本质、符号拆解、实例推导、判定规则到核心性质,讲得透彻、严谨、可落地。

一、先搞懂:我们为什么要学指数族分布?

在概率论中,我们学过正态分布、二项分布、泊松分布、伽马分布、贝塔分布等几十种常见分布,它们的概率公式形式各异,推导期望、方差、充分统计量时,往往要每个分布单独计算,非常繁琐。

而统计学家发现:绝大多数常用的概率分布,都可以被纳入一个统一的数学框架中,这个框架就是指数族分布
它的核心价值在于:

  1. 统一化:把零散的分布用一套标准形式表达,一次性推导整类分布的通用性质,无需逐个重复计算;
  2. 简化推断:直接给出参数的充分统计量,大幅降低统计估计的复杂度;
  3. 模型基石:是广义线性模型(GLM)、贝叶斯统计、概率机器学习、变分推断的核心理论支撑。

一句话总结:指数族分布不是一个单一分布,而是一大类具有共同数学结构的分布的统称,是统计建模的“通用语言”。


二、基本定义:逐符号、逐部分拆解本质

2.1 标准定义

若随机变量\(X\)的概率质量函数(离散型)或概率密度函数(连续型)\(f(x,\theta)\),可以写成如下标准指数族形式,则称\(X\)服从指数族分布:

\[f(x,\theta) = h(x) \exp\left\{ Q^\text{T}(\theta) T(x) - b(\theta) \right\} = \exp\left\{ Q^\text{T}(\theta) T(x) - b(\theta) - c(x) \right\} \]

两种形式完全等价:因为\(h(x) = e^{-c(x)}\),把\(h(x)\)纳入指数项,就得到第二种形式,无需困惑。

2.2 核心组成部分:逐个讲透含义、要求与作用

指数族的核心精髓,是把参数和样本完全分离,我们逐个拆解每个部分的本质:

1. 参数与参数空间:\(\theta \in \Theta\)

  • \(\theta\)是分布的未知参数向量,可以是一维(如二项分布的成功概率\(\theta\)、泊松分布的强度\(\lambda\)),也可以是多维(如正态分布的\(\theta=(\mu,\sigma^2)\)、伽马分布的\(\theta=(\lambda,\nu)\));
  • \(\Theta\)参数空间,即参数\(\theta\)所有合法取值的集合(如二项分布\(\theta \in (0,1)\),正态分布\(\mu \in \mathbb{R}, \sigma^2>0\))。

2. 自然参数(典则参数):\(Q(\theta) = (Q_1(\theta), Q_2(\theta), \dots, Q_k(\theta))^\text{T}\)

  • 它是对原始参数\(\theta\)的函数变换,是指数族的核心参数,维度为\(k\)\(k\)是指数族的阶数,单参数指数族\(k=1\),双参数\(k=2\));
  • 核心要求:\(1, Q_1(\theta), \dots, Q_k(\theta)\) 必须线性无关,即不存在不全为0的常数,使得它们的线性组合恒等于0。若线性相关,可合并项降维,得到“极小、满秩”的形式;
  • 作用:把原始参数转化为指数族的标准参数形式,实现参数与样本的乘积分离。

3. 充分统计量:\(T(x) = (T_1(x), T_2(x), \dots, T_k(x))^\text{T}\)

  • 这是仅关于样本\(x\)的函数,与参数\(\theta\)完全无关,这是铁律!维度与\(Q(\theta)\)完全一致,二者做内积\(Q^\text{T}(\theta)T(x) = \sum_{i=1}^k Q_i(\theta)T_i(x)\)
  • 核心要求:\(1, T_1(x), \dots, T_k(x)\) 必须线性无关,否则可合并降维;
  • 本质意义:根据因子分解定理,\(T(x)\)就是参数\(\theta\)充分统计量——它包含了样本中所有关于未知参数\(\theta\)的信息,是统计推断的核心。

4. 势函数(对数配分函数):\(b(\theta)\)

  • 仅关于参数\(\theta\)的函数,与样本\(x\)完全无关;
  • 核心作用:概率归一化。概率密度/质量函数必须满足“积分/求和等于1”,代入指数族形式可得:

    \[\int h(x) \exp\left\{ Q^\text{T}(\theta) T(x) - b(\theta) \right\} dx = e^{-b(\theta)} \int h(x) \exp\left\{ Q^\text{T}(\theta) T(x) \right\} dx = 1 \]

    两边取对数,得到\(b(\theta)\)的本质:

    \[b(\theta) = \log \left( \int h(x) \exp\left\{ Q^\text{T}(\theta) T(x) \right\} dx \right) \]

    其中积分项称为“配分函数”,因此\(b(\theta)\)也叫对数配分函数;
  • 关键价值:分布的期望、方差、各阶矩,都可以通过对\(b(\theta)\)求导直接得到,无需计算复杂积分。

5. 基底函数:\(h(x)\)(对应\(c(x) = -\log h(x)\)

  • 仅关于样本\(x\)的非负可测函数,与参数\(\theta\)完全无关,满足\(h(x) \geq 0\)
  • 核心作用1:定义分布的支撑集(即\(f(x,\theta)>0\)\(x\)的集合)。因为指数项恒正,所以\(f(x,\theta)>0\)当且仅当\(h(x)>0\),支撑集与参数\(\theta\)无关;
  • 核心作用2:承担样本的基础权重,比如泊松分布的\(h(x)=1/x!\)、二项分布的\(h(x)=\binom{n}{x}\),都是仅与样本有关的项。

2.3 极小、满秩的指数族

教材中提到的“极小、满秩”,本质是指数族的最简无冗余表示
\(1,Q_1(\theta),\dots,Q_k(\theta)\)\(1,T_1(x),\dots,T_k(x)\)分别线性无关时,我们无法再合并项、降低\(k\)的维度,此时的指数族就是极小、满秩的。
举个例子:若\(Q_2=2Q_1\),则\(Q_1T_1 + Q_2T_2 = Q_1(T_1+2T_2)\),可将二维项合并为一维,说明原表示存在冗余,不是极小的。
我们后续研究的指数族,均默认是极小、满秩的。


三、手把手实例推导:把常见分布化为指数族标准形式

掌握“把分布化为指数族形式”,是检验你是否理解的核心标准。这里给大家一个通用四步转化法

  1. 写出分布的概率密度/质量函数,明确支撑集;
  2. 利用\(a^b = \exp(b\log a)\),把所有乘法项转化为指数形式;
  3. 拆分指数内的项,分离出「参数×样本函数」项、「仅参数项」、「仅样本项」;
  4. 对应标准形式,匹配\(Q(\theta), T(x), b(\theta), h(x)\)

下面我们逐个拆解教材中的经典例子,每一步都清晰可追溯。

例1:正态分布 \(X \sim N(\mu, \sigma^2)\)\(\theta=(\mu, \sigma^2)\)

  1. 写出密度函数:

    \[f(x,\theta) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left\{ -\frac{(x-\mu)^2}{2\sigma^2} \right\}, \quad x \in \mathbb{R} \]

  2. 展开平方项,全部纳入指数:

    \[f(x,\theta) = \exp\left\{ -\log\sqrt{2\pi \sigma^2} + \frac{-x^2 + 2\mu x - \mu^2}{2\sigma^2} \right\} \]

  3. 拆分指数内的项:

    \[\underbrace{-\frac{1}{2\sigma^2} \cdot x^2 + \frac{\mu}{\sigma^2} \cdot x}_{参数×样本项} \underbrace{- \frac{\mu^2}{2\sigma^2} - \log\sqrt{2\pi \sigma^2}}_{仅参数项} \]

  4. 匹配标准形式:
    • 自然参数:\(Q_1(\theta) = -\frac{1}{2\sigma^2}\)\(Q_2(\theta) = \frac{\mu}{\sigma^2}\)
    • 充分统计量:\(T_1(x) = x^2\)\(T_2(x) = x\)
    • 势函数:\(b(\theta) = \frac{\mu^2}{2\sigma^2} + \log\sqrt{2\pi \sigma^2}\)
    • 基底函数:\(h(x)=1\)(无仅样本项)

拓展\(n\)个独立同分布的正态样本\(X_1,\dots,X_n\),联合密度的充分统计量为\(T(x)=(\sum_{i=1}^n x_i^2, \sum_{i=1}^n x_i)\),与因子分解定理的结论完全一致。

例2:二项分布 \(X \sim b(n,\theta)\)\(n\)已知,未知参数为\(\theta\)

  1. 写出概率质量函数:

    \[f(x,\theta) = \binom{n}{x} \theta^x (1-\theta)^{n-x}, \quad x=0,1,\dots,n \]

  2. 转化为指数形式:

    \[f(x,\theta) = \exp\left\{ \log\binom{n}{x} + x\log\theta + (n-x)\log(1-\theta) \right\} \]

  3. 拆分项:

    \[\underbrace{\log\left( \frac{\theta}{1-\theta} \right) \cdot x}_{参数×样本项} + \underbrace{n\log(1-\theta)}_{仅参数项} + \underbrace{\log\binom{n}{x}}_{仅样本项} \]

  4. 匹配标准形式:
    • 自然参数:\(Q_1(\theta) = \log\left( \frac{\theta}{1-\theta} \right)\)(即logit函数,逻辑回归的核心)
    • 充分统计量:\(T_1(x) = x\)
    • 势函数:\(b(\theta) = -n\log(1-\theta)\)
    • 基底函数:\(h(x) = \binom{n}{x}\)

例3:泊松分布 \(X \sim P(\lambda)\),参数\(\lambda>0\)

  1. 写出概率质量函数:

    \[f(x,\lambda) = \frac{\lambda^x e^{-\lambda}}{x!}, \quad x=0,1,2,\dots \]

  2. 转化为指数形式:

    \[f(x,\lambda) = \frac{1}{x!} \exp\left\{ x\log\lambda - \lambda \right\} \]

  3. 匹配标准形式:
    • 自然参数:\(Q_1(\lambda) = \log\lambda\)
    • 充分统计量:\(T_1(x) = x\)
    • 势函数:\(b(\lambda) = \lambda\)
    • 基底函数:\(h(x) = \frac{1}{x!}\)

例4:伽马分布 \(X \sim \Gamma(\lambda,\nu)\)\(\theta=(\lambda,\nu)\)

  1. 写出密度函数:

    \[f(x,\theta) = \frac{\lambda^\nu}{\Gamma(\nu)} x^{\nu-1} e^{-\lambda x} I\{x>0\} \]

    其中\(I\{x>0\}\)为指示函数,\(x>0\)时取1,否则为0。
  2. 转化为指数形式:

    \[f(x,\theta) = I\{x>0\} \cdot \exp\left\{ -\lambda x + (\nu-1)\log x + \nu\log\lambda - \log\Gamma(\nu) \right\} \]

  3. 匹配标准形式:
    • 自然参数:\(Q_1(\theta) = -\lambda\)\(Q_2(\theta) = \nu-1\)
    • 充分统计量:\(T_1(x) = x\)\(T_2(x) = \log x\)
    • 势函数:\(b(\theta) = \log\Gamma(\nu) - \nu\log\lambda\)
    • 基底函数:\(h(x) = I\{x>0\}\)

关键反例:带位置参数的指数分布,为什么不是指数族?

带位置参数的指数分布\(E(\lambda,\mu)\),密度函数为:

\[f(x,\theta) = \lambda e^{-\lambda(x-\mu)} I\{x\geq\mu\}, \quad \theta=(\lambda,\mu) \]

转化为指数形式后为:

\[f(x,\theta) = \exp\left\{ -\lambda x + \lambda\mu + \log\lambda \right\} I\{x\geq\mu\} \]

核心问题出在指示函数\(I\{x\geq\mu\}\):它同时包含样本\(x\)和参数\(\mu\),无法写成仅与\(x\)有关的\(h(x)\),因此不符合指数族的定义。这就引出了指数族的核心判定规则。


四、指数族的判定:共同支撑集的必要条件

4.1 支撑集的定义

分布的支撑集\(S_\theta = \{x: f(x,\theta) > 0\}\),即密度/质量函数大于0的样本\(x\)的取值集合。

4.2 核心推论

从指数族的定义可知,\(f(x,\theta)>0\)当且仅当\(h(x)>0\),而\(h(x)\)与参数\(\theta\)完全无关,因此:

指数族分布必有共同的支撑集,即支撑集\(S_\theta\)与参数\(\theta\)无关。
这是一个分布族属于指数族的必要条件(非充分条件)

4.3 快速判定应用

这个推论可以让我们瞬间排除非指数族分布:

  1. 均匀分布\(R(0,\theta)\):支撑集为\([0,\theta]\),与参数\(\theta\)有关,不是指数族;
  2. 带位置参数的指数分布\(E(\lambda,\mu)\):支撑集为\([\mu,+\infty)\),与参数\(\mu\)有关,不是指数族;
  3. 双参数Pareto分布:支撑集与位置参数有关,不是指数族;
  4. 柯西分布:支撑集为\(\mathbb{R}\)(与参数无关),但无法写成指数族标准形式,因此共同支撑集是必要非充分条件。

五、指数族分布的核心性质(统一框架的核心价值)

我们费这么大劲把分布统一为指数族,核心就是这些通用性质,无需逐个分布重复推导。

1. 充分性:直接给出参数的充分统计量

对于\(n\)个独立同分布的指数族样本\(X_1,\dots,X_n\),联合密度为:

\[f(x,\theta) = \left( \prod_{i=1}^n h(x_i) \right) \exp\left\{ Q^\text{T}(\theta) \sum_{i=1}^n T(x_i) - n b(\theta) \right\} \]

根据因子分解定理,参数\(\theta\)的充分统计量为\(T(X) = \sum_{i=1}^n T(x_i)\)
这意味着:我们只需要统计\(T(X)\),就包含了所有样本中关于参数的信息,极大简化了统计推断。

2. 矩计算:求导即可得到期望与方差

指数族的矩可以通过对势函数\(b(\theta)\)求导直接得到,无需计算复杂积分:

  • 一阶导数(梯度):\(\mathbb{E}[T(X)] = \nabla b(\theta)\),即\(T(X)\)的期望等于\(b(\theta)\)的一阶导数;
  • 二阶导数(海森矩阵):\(\text{Cov}(T(X)) = \nabla^2 b(\theta)\),即\(T(X)\)的协方差矩阵等于\(b(\theta)\)的二阶导数。

举个例子:泊松分布的\(b(\lambda)=\lambda\)\(Q(\lambda)=\log\lambda\),求导得\(\mathbb{E}[X]=\lambda\)\(\text{Var}(X)=\lambda\),与泊松分布的性质完全一致。

3. 凸性:对数配分函数是凸函数

\(b(\theta)\)的海森矩阵是协方差矩阵,而协方差矩阵必为半正定矩阵,因此\(b(\theta)\)是关于自然参数\(Q(\theta)\)凸函数
这个性质是机器学习优化的核心:凸函数的优化问题存在全局最优解,广义线性模型的参数估计能收敛到全局最优,正是源于这个凸性。

4. 共轭先验:指数族的共轭先验也是指数族

贝叶斯统计中,共轭先验指先验分布与后验分布属于同一分布族。指数族分布的共轭先验,必然也是指数族分布,这大幅简化了贝叶斯推断的计算。
比如:二项分布的共轭先验是贝塔分布,泊松分布的共轭先验是伽马分布,正态分布的共轭先验是正态-逆伽马分布,均为指数族成员。

5. 广义线性模型的核心支撑

广义线性模型(GLM)是线性回归的推广,它的核心假设之一就是响应变量服从指数族分布。线性回归的正态分布、逻辑回归的二项分布、泊松回归的泊松分布,都属于指数族,因此可以用统一的迭代加权最小二乘法估计参数,实现了线性模型的通用化拓展。


六、总结与常见误区

6.1 分布分类总结

常见指数族分布 常见非指数族分布
正态分布、二项分布、泊松分布 均匀分布、带位置参数的指数分布
伽马分布、贝塔分布、指数分布 双参数Pareto分布、柯西分布
瑞利分布、多项分布、负二项分布 拉普拉斯分布、威布尔分布、超几何分布

6.2 常见误区澄清

  1. 指数族≠指数分布:指数分布只是指数族的一个成员,指数族是一大类分布的统称,切勿混淆;
  2. 共同支撑集是必要非充分条件:支撑集与参数无关的分布,不一定是指数族(如柯西分布);
  3. 指数族的表示不唯一:可对\(Q(\theta)\)\(T(x)\)做可逆线性变换,核心结构不变;
  4. 极小满秩是无冗余的要求:线性相关的项必须合并,否则会出现参数冗余。

指数族分布是从基础概率论到高级统计建模的关键桥梁,理解了它的本质,你就掌握了数理统计和机器学习中一大类模型的通用底层逻辑。

以下为指数族分布全维度核心内容的表格化系统总结,严格匹配教材定义、推导逻辑与核心知识点,覆盖定义拆解、经典实例、核心性质、判定规则、分布分类五大核心模块:


表1 指数族分布核心定义与组成部分详解表

组成项名称 数学表达式 核心约束要求 本质作用与核心意义
未知参数向量 \(\theta = (\theta_1,\theta_2,\dots,\theta_p)^\text{T}\),参数空间\(\theta \in \Theta\) 为分布的待估参数,可为一维/多维,参数空间为参数合法取值的集合 描述分布的不确定性,是统计推断的目标对象
自然参数(典则参数)向量 \(Q(\theta) = (Q_1(\theta),Q_2(\theta),\dots,Q_k(\theta))^\text{T}\) 仅与参数\(\theta\)有关,与样本\(x\)无关;\(1,Q_1(\theta),\dots,Q_k(\theta)\)线性无关(极小满秩要求) 对原始参数做函数变换,实现「参数-样本」的乘积分离,是指数族的核心参数
充分统计量向量 \(T(x) = (T_1(x),T_2(x),\dots,T_k(x))^\text{T}\) 仅与样本\(x\)有关,与参数\(\theta\)完全无关;\(1,T_1(x),\dots,T_k(x)\)线性无关(极小满秩要求);维度与\(Q(\theta)\)严格一致 包含样本中所有关于未知参数\(\theta\)的信息,是统计推断的核心载体,直接决定参数估计的效率
势函数(对数配分函数) \(b(\theta)\) 仅与参数\(\theta\)有关,与样本\(x\)完全无关 实现概率的归一化(保证密度/质量函数积分/求和为1);分布的各阶矩、期望、方差均可通过对其求导直接得到
基底函数 \(h(x) = e^{-c(x)}\) 仅与样本\(x\)有关,与参数\(\theta\)完全无关;非负可测,满足\(h(x) \geq 0\) 定义分布的支撑集(\(f(x,\theta)>0\)当且仅当\(h(x)>0\));承担样本的基础权重项
支撑集 \(S_\theta = \{x: f(x,\theta) > 0\}\) 指数族分布的支撑集必与参数\(\theta\)无关,仅由\(h(x)\)决定 指数族分布的核心判定依据之一,支撑集与参数相关的分布必不属于指数族

表2 经典概率分布的指数族标准形式拆解对照表

(严格匹配教材示例,所有拆解均为极小满秩形式)

分布名称 分布记号 未知参数\(\theta\) 自然参数\(Q(\theta)\) 充分统计量\(T(x)\) 势函数\(b(\theta)\) 基底函数\(h(x)\)
一维正态分布 \(X \sim N(\mu,\sigma^2)\) \(\theta=(\mu,\sigma^2)\) \(Q_1(\theta)=-\frac{1}{2\sigma^2}\)
\(Q_2(\theta)=\frac{\mu}{\sigma^2}\)
\(T_1(x)=x^2\)
\(T_2(x)=x\)
\(\frac{\mu^2}{2\sigma^2} + \log\sqrt{2\pi\sigma^2}\) \(1\)
二项分布(n已知) \(X \sim b(n,\theta)\) 成功概率\(\theta\) \(Q_1(\theta)=\log\left(\frac{\theta}{1-\theta}\right)\)(logit函数) \(T_1(x)=x\) \(-n\log(1-\theta)\) \(\binom{n}{x}\)
泊松分布 \(X \sim P(\lambda)\) 强度参数\(\lambda>0\) \(Q_1(\lambda)=\log\lambda\) \(T_1(x)=x\) \(\lambda\) \(\frac{1}{x!}\)
伽马分布 \(X \sim \Gamma(\lambda,\nu)\) \(\theta=(\lambda,\nu)\)(率参数、形状参数) \(Q_1(\theta)=-\lambda\)
\(Q_2(\theta)=\nu-1\)
\(T_1(x)=x\)
\(T_2(x)=\log x\)
\(\log\Gamma(\nu) - \nu\log\lambda\) \(I\{x>0\}\)(指示函数)
贝塔分布 \(X \sim BE(p,q)\) \(\theta=(p,q)\) \(Q_1(\theta)=p\)
\(Q_2(\theta)=q\)
\(T_1(x)=\log x\)
\(T_2(x)=\log(1-x)\)
\(\log\beta(p,q)\) \(\frac{1}{x(1-x)}I\{0\leq x\leq1\}\)
单参数指数分布 \(X \sim E(\lambda)\) 率参数\(\lambda>0\) \(Q_1(\lambda)=-\lambda\) \(T_1(x)=x\) \(-\log\lambda\) \(I\{x\geq0\}\)
瑞利分布 \(X \sim \text{Rayleigh}(\lambda)\) 参数\(\lambda>0\) \(Q_1(\lambda)=-\lambda\) \(T_1(x)=x^2\) \(-\log\lambda\) \(2xI\{x\geq0\}\)

表3 指数族分布核心性质与应用价值汇总表

性质名称 数学表达与核心结论 应用价值与说明
充分统计量性质 \(n\)个独立同分布的指数族样本,参数\(\theta\)的充分统计量为\(T(X)=\sum_{i=1}^n T(x_i)\) 无需使用全量样本,仅通过\(T(X)\)即可完成参数的无偏、有效估计,大幅降低统计推断的计算复杂度
矩快速计算性质 1. 期望:\(\mathbb{E}[T(X)] = \nabla b(\theta)\)\(b(\theta)\)的一阶梯度)
2. 方差/协方差:\(\text{Cov}(T(X)) = \nabla^2 b(\theta)\)\(b(\theta)\)的二阶海森矩阵)
无需计算复杂的积分/求和,仅通过对势函数求导即可得到分布的期望、方差,实现整类分布矩的统一计算
凸性性质 势函数\(b(\theta)\)是关于自然参数\(Q(\theta)\)的严格凸函数,其二阶海森矩阵半正定 是机器学习、广义线性模型参数优化的核心支撑:凸优化问题存在唯一全局最优解,保证参数估计的收敛性与唯一性
共轭先验性质 指数族分布的共轭先验必然也属于指数族分布 大幅简化贝叶斯推断的计算,先验与后验同分布族,无需复杂的数值积分即可完成后验概率的计算
支撑集不变性质 分布的支撑集\(S_\theta\)与未知参数\(\theta\)完全无关,仅由\(h(x)\)决定 提供了指数族分布的快速必要判定规则,可瞬间排除不符合该规则的非指数族分布
广义线性模型适配性 指数族分布天然满足广义线性模型(GLM)的响应变量分布假设 是线性回归、逻辑回归、泊松回归、生存分析等模型的统一理论基础,实现了线性模型的通用化拓展

表4 指数族分布判定规则与正反例对照表

判定规则 规则类型 核心判定逻辑 符合规则的正例 不符合规则的反例及排除原因
共同支撑集规则 必要条件(非充分) 分布的支撑集与参数\(\theta\)无关,才有可能属于指数族;若支撑集与参数有关,必不属于指数族 正态分布、泊松分布、二项分布、伽马分布(支撑集均与参数无关) 1. 均匀分布\(R(0,\theta)\):支撑集\([0,\theta]\)与参数\(\theta\)直接相关,排除
2. 带位置参数的指数分布\(E(\lambda,\mu)\):支撑集\([\mu,+\infty)\)与位置参数\(\mu\)相关,排除
3. 双参数Pareto分布:支撑集与位置参数相关,排除
标准形式可表性规则 充要条件 分布的密度/质量函数可严格表示为\(f(x,\theta) = h(x)\exp\{Q^\text{T}(\theta)T(x)-b(\theta)\}\)的形式,且满足各组成项的约束要求 表2中所有经典分布,均可严格匹配标准形式 1. 柯西分布:支撑集与参数无关,但无法表示为指数族标准形式,排除
2. 拉普拉斯分布:无法拆分为指数族标准的参数-样本分离形式,排除
3. 威布尔分布:无法匹配指数族标准形式,排除
极小满秩规则 最简表示要求 自然参数组、充分统计量组分别与常数1线性无关,无冗余项 表2中所有分布的拆解均为极小满秩形式 存在线性相关项的冗余指数族表示(如\(Q_2=2Q_1\)的二维表示),需合并降维为极小满秩形式

表5 常用概率分布的指数族归属分类表

常用指数族分布 常用非指数族分布
正态分布(一维/多维)、二项分布、多项分布 均匀分布、带位置参数的指数分布
泊松分布、负二项分布、Pascal分布 双参数Pareto分布、幂函数分布
伽马分布、逆伽马分布、贝塔分布 柯西分布、拉普拉斯分布、极值分布
单参数指数分布、瑞利分布、对数正态分布 威布尔分布、超几何分布
逆高斯分布 多参数带位置/尺度的非正则分布

posted on 2026-02-19 20:43  Indian_Mysore  阅读(1)  评论(0)    收藏  举报

导航