昆仑山:眼中无形心中有穴之穴人合一

夫君子之行,静以修身,俭以养德;非澹泊无以明志,非宁静无以致远。夫学须静也,才须学也;非学无以广才,非志无以成学。怠慢则不能励精,险躁则不能冶性。年与时驰,意与岁去,遂成枯落,多不接世。悲守穷庐,将复何及!

 

1.1.1分布函数与分布密度

数理统计基石:随机变量、分布函数与L-S积分 深度讲解

各位同学,今天我就把这部分内容的底层逻辑、核心定义、本质内涵、应用价值掰开揉碎讲清楚,帮大家筑牢数理统计的根基。

一、开篇引言:为什么这部分内容是数理统计的“根”?

首先我们要明确一个核心逻辑:随机变量是刻画随机现象的数学工具,而分布函数是随机变量的“完整身份证”——它完全描述了随机变量所有可能取值的概率规律,也就是原文所说的“完全描述了它的概率结构”。

但现实中存在一个核心矛盾:理论上,只要知道了总体的分布函数,我们就掌握了这个随机现象的全部概率规律;但在实际问题里,总体的分布函数几乎都是未知的。

  • 比如我们想知道一批灯泡的寿命分布,不可能把所有灯泡都测到报废;
  • 想知道某地区成年人的身高分布,不可能把所有人都测量一遍。

我们能拿到的,只有从总体中抽取的一部分样本。数理统计的核心任务,就是通过样本的观测值,去推断总体的未知分布,以及和分布相关的所有问题

这里我要给大家点透几个核心概念,是后续所有统计方法的前提:

  1. 独立同分布(i.i.d.)样本:这是统计推断最基础的假设。我们拿到的样本\(X_1,X_2,\dots,X_n\),每个样本都和总体服从完全相同的分布(保证样本能代表总体),且样本之间相互独立(保证我们能用概率工具计算统计量的规律)。
  2. 分布的两类形式
    • 非参数分布\(F(x)\):分布的形式完全未知,没有固定的表达式,对应非参数统计的研究范畴;
    • 参数分布\(F_\theta(x)\):分布的数学形式是确定的,只有有限个未知参数\(\theta\),比如正态分布\(N(\mu,\sigma^2)\),形式固定,只有均值\(\mu\)和方差\(\sigma^2\)未知;泊松分布\(P(\lambda)\)只有参数\(\lambda\)未知,这是参数统计的核心研究对象。
  3. 统计推断的核心内容:参数估计、假设检验、回归分析等,所有这些方法,都建立在随机变量和分布的基础上。原文说“随机变量及其分布函数,既是统计推断的目的,也是统计推断的基础”,就是这个道理——我们的目标是推断总体分布,而推断的工具,也完全依赖分布的性质。

本章的结构也给大家梳理清楚,让大家有整体框架:1.1节讲分布函数的基础性质,1.2-1.3节讲实际中最常用的离散型、连续型分布,1.4-1.5节讲统计推断常用的特殊分布(Γ分布、指数族),1.6节讲次序统计量的分布,这些都是后续统计方法的“工具库”。


二、概率空间:概率论的公理化基石

很多同学学概率直接跳过概率空间,直接学分布函数,这会导致后续对测度、积分的理解出现断层。概率空间是柯尔莫哥洛夫建立的概率论公理化体系的核心,所有的概率问题,都必须建立在这个三元组上

对于\(n\)维随机变量\(X\),它对应的概率空间记为\((\mathcal{X}, \mathcal{B}_X, P)\),我们逐个拆解每个部分的本质:

  1. 样本空间\(\mathcal{X}\):就是\(n\)维随机变量\(X\)所有可能取值的集合,是\(n\)维实数空间\(\mathbb{R}^n\)的子集。

    • 比如\(X\)是一维的灯泡寿命,\(\mathcal{X}\)就是\([0,+\infty)\)
    • 比如\(X\)是二维的(身高、体重),\(\mathcal{X}\)就是\(\mathbb{R}^2\)的第一象限。
      简单说,样本空间就是随机现象“所有可能出现的结果”的集合。
  2. 博雷尔域\(\mathcal{B}_X\):它是“我们能够计算概率的事件的集合”。
    这里要给大家讲透:不是所有的集合都能定义概率,比如实数集上的不可测集,我们无法给它一个符合概率公理的数值。而博雷尔域,就是从\(\mathbb{R}^n\)上所有的开区间(开集)出发,通过可数次交、并、补运算得到的所有集合的全体,这些集合叫博雷尔可测集
    我们平时说的“随机事件”,本质上就是博雷尔可测集;只有在这个集合里,我们才能合法地定义概率。

  3. 概率测度\(P\):它是给每个可测集(随机事件)分配一个\([0,1]\)之间数值的映射,这个数值就是概率。
    它必须满足概率的三大公理:

    • 非负性:对任意事件\(A\)\(P(A)\geq0\)
    • 规范性:必然事件\(P(\mathcal{X})=1\)
    • 可列可加性:两两互斥的事件,它们的并的概率等于每个事件概率的和。
      原文中\(P(A)=P(X\in A)\),就是“随机变量\(X\)落在集合\(A\)中的概率”,也就是这个事件的概率。

最后补充一下记号:\(P_\theta\)\(P_X\)\(P_\theta^X\),这些都是概率测度的常用记号:\(P_X\)是随机变量\(X\)对应的概率测度,\(P_\theta\)是依赖于未知参数\(\theta\)的概率测度,这些记号在后续似然函数、充分统计量的推导中会频繁用到,大家先熟悉起来。


三、一元分布函数:定义、核心性质与分类

这部分是整个内容的核心,是把随机的概率问题转化为确定性函数问题的关键一步。

3.1 分布函数的定义

对于一维随机变量\(X\in\mathbb{R}\),它的分布函数定义为:

\[F(x) = P(X \leq x) = P\{X \in (-\infty,x]\} \]

我给大家讲透这个定义的本质:分布函数\(F(x)\),就是“随机变量\(X\)的取值不超过\(x\)的概率”。它是一个关于\(x\)的普通确定性函数,定义域是全体实数\(\mathbb{R}\),值域是\([0,1]\)
这个定义的伟大之处,就在于它把抽象的、随机的概率问题,转化成了我们熟悉的、可以用微积分工具分析的确定性函数问题,这是概率论发展史上的关键一步。

3.2 分布函数的四大核心性质(充要条件)

这四个性质是判断一个函数是不是分布函数的充要条件——也就是说,一个函数是分布函数,当且仅当它同时满足这四个性质,所有的判断题、证明题都离不开这个核心。

  1. 单调不减性(非降性)
    对任意的\(x_1 < x_2\),必有\(F(x_1) \leq F(x_2)\)
    本质解释:事件\(\{X \leq x_1\}\)\(\{X \leq x_2\}\)的子集——\(X\)不超过更小的\(x_1\),那必然不超过更大的\(x_2\)。根据概率的单调性,子集的概率不会超过全集的概率,因此\(F(x_1)\leq F(x_2)\)

  2. 右连续性
    对任意实数\(x\),有\(F(x+0) = F(x)\),也就是从\(x\)的右侧趋近于\(x\)时,函数的极限等于\(F(x)\)本身。
    这里是大家最容易混淆的点,我重点讲透:

    • 左极限:\(F(x-0) = \lim_{h\to0^+}F(x-h) = P(X < x)\),也就是\(X\)严格小于\(x\)的概率;
    • 分布函数的定义是\(P(X\leq x)\),因此\(F(x) = P(X < x) + P(X = x)\),即\(F(x) - F(x-0) = P(X=x)\)
      这个式子非常重要:分布函数在\(x\)点的左极限与函数值的差,就是\(X\)\(x\)这个点的概率
      而右连续的本质,是因为当\(h\to0^+\)时,事件\(\{X\leq x+h\}\)的极限事件就是\(\{X\leq x\}\),根据概率的上连续性,极限的概率等于概率的极限,因此\(F(x+0)=F(x)\)
  3. 负无穷极限为0

    \[F(-\infty) = \lim_{x\to-\infty}F(x) = 0 \]

    本质:\(X\leq -\infty\)是不可能事件,不可能事件的概率为0。当\(x\)向负无穷趋近时,\(X\)不超过\(x\)的概率会无限趋近于0。

  4. 正无穷极限为1

    \[F(+\infty) = \lim_{x\to+\infty}F(x) = 1 \]

    本质:\(X\leq +\infty\)是必然事件,必然事件的概率为1。当\(x\)向正无穷趋近时,\(X\)不超过\(x\)的概率会无限趋近于1。

3.3 分布函数的三大分类

根据勒贝格分解定理,任何一个分布函数,都可以分解为离散型、绝对连续型、奇异型的凸组合,我们重点关注前两类,奇异型仅做了解。

3.3.1 离散型分布

定义:如果随机变量\(X\)的取值只有有限个,或者可列无穷个(比如正整数\(1,2,3,\dots\)),则\(X\)为离散型随机变量,对应的分布函数为离散型分布函数。

离散型随机变量的概率规律,完全由分布列(概率质量函数)决定:

\[P(X=x_k) = p_k \triangleq f(x_k),\quad k=1,2,\dots \]

分布列必须满足两个核心条件:

  1. 非负性:\(p_k \geq 0\),对所有\(k\)成立;
  2. 规范性:\(\sum_{k} p_k = 1\),所有可能取值的概率之和为1。

原文给出了离散型分布函数的统一表达式:

\[F(x) = \sum_{k} p_k \Delta(x-x_k) = \sum_{k} p_k I\{x_k \leq x\} = \sum_{x_k \leq x} p_k = \sum_{x_k \leq x} f(x_k) \]

我给大家逐个拆解每个部分的含义:

  1. \(\Delta(x)\)是退化分布的分布函数(单位阶跃函数):\(\Delta(x)=1\)\(x\geq0\)\(\Delta(x)=0\)\(x<0\)\(\Delta(x-x_k)\)就是在\(x_k\)点发生跳跃的阶跃函数,\(x\geq x_k\)时取1,否则取0。
  2. \(I\{x_k \leq x\}\)示性函数(指示函数),这是概率论中最常用的工具之一,定义为:

    \[I_A(x) = \begin{cases}1, & x\in A \\ 0, & x\notin A\end{cases} \]

    这里\(I\{x_k \leq x\}\)就是当\(x_k \leq x\)时取1,否则取0,和\(\Delta(x-x_k)\)完全等价。
  3. 整个式子的本质:离散型分布函数,是所有小于等于\(x\)的取值点对应的概率之和。它是一个阶梯函数,在每个取值点\(x_k\)处向上跳跃,跳跃的高度就是该点的概率\(p_k\),两个相邻跳跃点之间,\(F(x)\)是常数。

举两个最典型的例子:

  • 0-1分布(伯努利分布):\(X\)只能取0和1,\(P(X=1)=p\)\(P(X=0)=1-p\)。它的分布函数为:

    \[F(x)=\begin{cases}0, & x<0 \\ 1-p, & 0\leq x<1 \\ 1, & x\geq1\end{cases} \]

    这是典型的阶梯函数,在0点跳跃\(1-p\),在1点跳跃\(p\)
  • 泊松分布:\(P(X=k)=e^{-\lambda}\frac{\lambda^k}{k!},k=0,1,2,\dots\),它的分布函数\(F(x)\)就是所有不超过\(x\)的非负整数\(k\)对应的概率之和,比如\(F(2.5)=P(X=0)+P(X=1)+P(X=2)\)

3.3.2 绝对连续型分布

定义:如果存在一个非负可积的函数\(f(x)\),使得对任意实数\(x\),都有

\[F(x) = \int_{-\infty}^x f(y)dy \]

则称\(F(x)\)为绝对连续型分布函数,\(f(x)\)\(X\)概率密度函数,简称密度函数。

这里我要给大家讲透几个核心要点,也是大家最容易出错的地方:

  1. 密度函数的核心性质

    • 非负性:\(f(x)\geq0\),对所有\(x\in\mathbb{R}\)成立;
    • 规范性:\(\int_{-\infty}^{+\infty}f(x)dx=1\),对应\(F(+\infty)=1\)
    • 概率计算:对任意博雷尔集\(A\)\(P(X\in A)=\int_A f(y)dy\),即\(X\)落在\(A\)中的概率,等于密度函数在\(A\)上的积分。
  2. 关键结论:连续型随机变量的单点概率为0
    对任意实数\(x\),都有\(P(X=x)=0\)
    原因很简单:\(P(X=x)=F(x)-F(x-0)\),而\(F(x)\)是变上限积分,是处处连续的函数,因此\(F(x-0)=F(x)\),单点概率为0。
    这就带来一个重要结论:对连续型随机变量,\(P(a<X<b)=P(a\leq X<b)=P(a<X\leq b)=P(a\leq X\leq b)\),有没有等号不影响结果,这和离散型随机变量完全不同,离散型必须严格关注等号。

  3. 密度与分布函数的关系
    \(f(x)\)的连续点处,有\(F'(x)=f(x)\),即密度函数是分布函数的导数,分布函数是密度函数的变上限积分,这是微积分基本定理的直接应用。

这里必须提醒大家一个高频易错点:连续型的密度函数\(f(x)\)不是概率!
\(f(x)\)的取值可以大于1,只有它的积分才是概率;而离散型的\(p_k\)本身就是概率,取值一定在\([0,1]\)之间,这两个概念绝对不能混淆。

3.3.3 奇异型分布

这类分布函数是连续的,但它的导数几乎处处为0,不存在密度函数,它的“增长”全部集中在一个勒贝格测度为0的集合上(比如康托分布)。这类分布仅在概率论理论研究中有意义,实际统计问题中几乎不会遇到,大家了解即可。


四、Lebesgue-Stieltjes积分:离散与连续的统一框架

很多同学学到这里觉得难,本质是没搞懂“我们为什么要引入L-S积分”。我先给大家讲清楚它的核心价值:
我们之前学的,离散型的概率是求和,连续型的概率是积分;离散型的期望是求和,连续型的期望是积分,两个形式完全不同。而L-S积分的核心作用,就是把离散型的求和和连续型的黎曼积分,统一成一个数学表达式
有了这个统一的框架,我们在推导统计定理、计算概率和期望时,不需要再区分离散型和连续型,用一个式子就能完成,大大简化了理论推导的复杂度,也让结论更具一般性。

4.1 L-S积分的定义

L-S积分针对两个核心对象:

  • 被积函数\(g(x)\):有界可测函数,比如我们要算期望的\(\phi(X)\)、计算概率的示性函数\(I_A(x)\)
  • 测度\(\mu(\cdot)\):可以理解为给集合分配“长度/权重”的映射,不同的测度对应不同的积分形式。

原文给出的定义:把区间\([a,b]\)划分为有限个互不相交的可测集\(\Delta x_i\),计算下和\(S_m=\sum_{i=1}^n m_i \mu(\Delta x_i)\)\(m_i\)\(g(x)\)\(\Delta x_i\)上的最小值)、上和\(S_M=\sum_{i=1}^n M_i \mu(\Delta x_i)\)\(M_i\)\(g(x)\)\(\Delta x_i\)上的最大值)。当划分无限细化,即\(\max_{1\leq i\leq n}\{\mu(\Delta x_i)\}\to0\)时,若上和与下和的极限存在且相等,这个极限就是\(g(x)\)\([a,b]\)上关于测度\(\mu\)的L-S积分,记为:

\[\int_a^b g(x)d\mu(x) \quad \text{或} \quad \int_a^b g(x)\mu(dx) \]

4.2 两种核心情况:对应连续型与离散型

原文给出的两种情况,正好对应我们最常用的连续型和离散型分布,这是L-S积分最核心的应用。

情况1:\(\mu(\cdot)\)为勒贝格测度

勒贝格测度,就是我们平时说的“长度”:对于区间\(\Delta x_i=(c,d)\),勒贝格测度\(\mu(\Delta x_i)=d-c\),也就是区间的长度。
此时,L-S积分直接退化为我们熟悉的黎曼积分

\[\int_a^b g(x)d\mu(x) = \int_a^b g(x)dx \]

对应到连续型分布:
连续型的分布函数\(F(x)=\int_{-\infty}^x f(y)dy = \int_{-\infty}^x f(y)d\mu(y)\),这里的\(\mu\)就是勒贝格测度;
概率计算\(P(X\in A)=\int_A f(y)d\mu(y)\),和我们之前的定义完全一致。

情况2:\(\mu(\cdot)\)为计数测度

计数测度,就是数集合中包含的点的个数:对于点列\(\{x_k\}\),计数测度\(\mu(A)\)就是集合\(A\)中包含的\(x_k\)的数量,有几个点,\(\mu(A)\)就是几,没有就是0。
此时,L-S积分直接退化为求和

\[\int_a^b g(x)d\mu(x) = \sum_{x_k\in[a,b]} g(x_k) \]

对应到离散型分布:
离散型的分布函数\(F(x)=\sum_{x_k\leq x}f(x_k) = \int_{-\infty}^x f(y)d\mu(y)\),这里的\(\mu\)就是计数测度;
概率计算\(P(X\in A)=\sum_{x_k\in A}p_k = \int_A f(y)d\mu(y)\),和离散型的定义完全一致。

到这里大家就明白了:离散型和连续型的分布函数,完全可以用同一个L-S积分的式子表示,只是对应的测度不同——连续型用勒贝格测度,离散型用计数测度,这就是统一的核心。

4.3 统一的期望与概率表达式

有了L-S积分,我们就可以给出期望和概率的统一表达式,这是它在数理统计中最重要的应用。

1. 数学期望的统一表达式

对任意可测函数\(\phi(X)\)(比如\(X\)的函数、矩、示性函数),无论\(X\)是离散型还是连续型,它的数学期望都可以写成:

\[\mathbb{E}[\phi(X)] = \int \phi(x)f(x)d\mu(x) = \int \phi(x)dF(x) \]

其中\(dF(x)=f(x)d\mu(x)\),称为L-S微分,这个式子也叫黎曼-斯蒂尔切斯积分,用分布函数\(F(x)\)表示,更方便统计推导。

我们验证一下:

  • 离散型:\(\int \phi(x)dF(x) = \sum_{k}\phi(x_k)p_k\),和离散型期望的定义完全一致;
  • 连续型:\(\int \phi(x)dF(x) = \int_{-\infty}^{+\infty}\phi(x)f(x)dx\),和连续型期望的定义完全一致。

2. 概率的统一表达式

对于任意事件\(A\),概率就是示性函数的期望:\(\mathbb{E}[I_A(X)]=P(X\in A)\),因此概率的统一表达式为:

\[P(X\in A) = \int_{\mathcal{X}} I_A(x)dF(x) = \int_A dF(x) \]

  • 离散型:\(\int_A dF(x) = \sum_{x_k\in A}p_k\)
  • 连续型:\(\int_A dF(x) = \int_A f(x)dx\)

4.4 拓展说明

L-S积分可以直接推广到\(n\)维空间,对应多维随机变量的联合分布、联合期望的计算,逻辑和一维完全一致,只是把区间换成\(n\)维长方体,测度换成\(n\)维勒贝格测度或计数测度。


五、总结与学习经验提醒

最后,我给大家把整个知识点的逻辑链条串起来,再分享我六十余年教学中总结的学习要点:

完整逻辑框架

  1. 底层基础:概率空间\((\mathcal{X},\mathcal{B}_X,P)\),是所有概率问题的公理化前提,定义了什么是事件、什么是概率。
  2. 核心工具:分布函数\(F(x)=P(X\leq x)\),把随机的概率问题转化为确定性的函数问题,完全刻画了随机变量的概率规律。
  3. 两大类型:离散型分布(阶梯函数,分布列刻画)、连续型分布(连续函数,密度函数刻画),是实际应用的核心。
  4. 统一框架:L-S积分,把离散求和与连续积分统一为一个表达式,让统计理论推导无需区分离散与连续,是数理统计的核心数学工具。
  5. 最终目标:所有这些内容,都是为后续的统计推断服务——无论是参数估计、假设检验,还是回归分析、多元统计,都离不开分布函数的性质,离不开用积分定义的期望、方差等数字特征。

学习经验与易错点提醒

  1. 绝对不要跳过基础:很多同学急于学t检验、方差分析、回归模型,却忽略了这部分基础,最终只会套公式,遇到非标准的问题就束手无策。这部分内容是根,根扎稳了,后续的方法才能学透。
  2. 分清密度与概率:连续型的密度函数不是概率,取值可以大于1,只有积分才是概率;离散型的分布列本身就是概率,必须在0到1之间,这个错误绝对不能犯。
  3. 记准分布函数的右连续性:不要记成左连续,一定要记住\(F(x)-F(x-0)=P(X=x)\),这个式子是连接分布函数与单点概率的核心。
  4. 掌握示性函数这个万能工具:很多复杂的概率、期望计算,都可以用示性函数转化为积分,这个技巧在统计推导中会反复用到。
  5. 理解L-S积分的核心是统一:不用死记硬背积分的定义,只要记住\(\int \phi(x)dF(x)\)这个统一的期望表达式,知道它对离散和连续都适用,就掌握了它的核心价值。

以下为本次讲解全部核心知识点的结构化表格归纳,覆盖基础定义、核心性质、分类对比、工具方法与统一表达式,方便系统梳理、查阅与记忆。


表1 概率空间三元组(概率论公理化基础)

三元组组成 符号 严格定义 本质内涵 补充说明
样本空间 \(\mathcal{X}\) \(n\)维随机变量\(X\)所有可能取值构成的集合,是\(\mathbb{R}^n\)的子集 随机现象所有可能结果的全集,是概率定义的载体 一维随机变量对应\(\mathbb{R}\)的子集,如灯泡寿命对应\([0,+\infty)\)
博雷尔域(事件域) \(\mathcal{B}_X\) \(\mathbb{R}^n\)上所有开集经可数次交、并、补运算生成的σ代数,其中的元素称为博雷尔可测集 所有可定义概率的随机事件的集合,排除不可测集 日常所说的“随机事件”,本质上都是\(\mathcal{B}_X\)中的可测集
概率测度 \(P\)(也记\(P_\theta,P_X,P_\theta^X\) 定义在\(\mathcal{B}_X\)上,满足概率三大公理(非负性、规范性、可列可加性)的集函数,对任意\(A\in\mathcal{B}_X\)\(P(A)=P(X\in A)\) 给每个随机事件分配\([0,1]\)区间内概率值的映射,是概率的数学本质 三大公理是概率定义的核心,所有概率性质均由此推导而来

表2 一元分布函数核心知识点(统计推断的核心基础)

项目 详细内容
标准定义 对一维随机变量\(X\in\mathbb{R}\),分布函数定义为:
$$F(x) = P(X \leq x) = P{X \in (-\infty,x]}, \quad x\in(-\infty,+\infty)$$
核心意义 将抽象的随机概率问题转化为确定性的实值函数问题,完全刻画随机变量的全部概率结构,是统计推断的核心对象与基础
四大充要性质
(判断分布函数的唯一标准)
1. 单调不减性:对任意\(x_1<x_2\),必有\(F(x_1)\leq F(x_2)\)
2. 右连续性:对任意实数\(x\)\(\lim_{h\to0^+}F(x+h)=F(x+0)=F(x)\)
3. 负无穷极限为0\(\lim_{x\to-\infty}F(x)=F(-\infty)=0\)
4. 正无穷极限为1\(\lim_{x\to+\infty}F(x)=F(+\infty)=1\)
关键衍生公式 1. 单点概率:\(P(X=x) = F(x) - F(x-0)\),其中\(F(x-0)\)\(x\)处的左极限
2. 区间概率:对任意\(a<b\)\(P(a<X\leq b) = F(b) - F(a)\)
3. 严格小于的概率:\(P(X<x) = F(x-0)\)

表3 分布函数三大类型详细对比表

分布类型 核心定义 概率刻画核心工具 分布函数表达式 核心性质 典型代表 关键备注/易错点
离散型分布 随机变量\(X\)的取值为有限个或可列无穷个 分布列(概率质量函数):
\(P(X=x_k)=p_k\triangleq f(x_k)\)
阶梯型函数:
$$F(x)=\sum_{x_k\leq x}p_k=\sum_{k}p_k I{x_k\leq x}$$
1. 分布列满足:\(p_k\geq0\)\(\sum_k p_k=1\)
2. 分布函数在\(x_k\)处发生跳跃,跳跃高度为\(p_k\)
3. 相邻跳跃点之间函数值为常数
0-1分布、二项分布、泊松分布、几何分布 1. \(p_k\)本身就是概率,取值必在\([0,1]\)区间内
2. 区间概率计算必须严格关注等号,单点概率不为0
绝对连续型分布 存在非负可积函数\(f(x)\),使得对任意\(x\)\(F(x)=\int_{-\infty}^x f(y)dy\) 概率密度函数\(f(x)\) 变上限积分函数:
$$F(x)=\int_{-\infty}^x f(y)d\mu(y)$$(\(\mu\)为勒贝格测度)
1. 密度函数满足:\(f(x)\geq0\)\(\int_{-\infty}^{+\infty}f(x)dx=1\)
2. 分布函数在\(\mathbb{R}\)上处处连续
3. 在\(f(x)\)的连续点处,\(F'(x)=f(x)\)
正态分布、均匀分布、指数分布、卡方分布 1. 密度函数\(f(x)\)不是概率,取值可大于1,仅积分结果为概率
2. 任意单点概率\(P(X=x)=0\),区间概率计算无需区分是否带等号
奇异型分布 分布函数连续,但几乎处处可导且导数为0,不存在密度函数,其增长集中在勒贝格测度为0的集合上 无常规概率刻画工具 无初等表达式 仅在概率论理论研究中出现,无实际统计应用 康托分布 实际应用场景中几乎不会遇到,仅需了解概念即可

表4 示性函数(指示函数)核心知识点

项目 详细内容
标准定义 对任意集合\(A\),示性函数\(I_A(x)\)(也记\(I\{A\}\))定义为:
$$I_A(x) = \begin{cases}1, & x\in A \ 0, & x\notin A\end{cases}$$
常用简化形式 1. 事件示性:\(I\{x_k\leq x\}\),当\(x_k\leq x\)时取1,否则取0
2. 区间示性:\(I\{a<x\leq b\}\),当\(x\in(a,b]\)时取1,否则取0
核心性质 1. 非负性:\(I_A(x)\geq0\)恒成立
2. 乘法性质:\(I_A(x)\cdot I_B(x)=I_{A\cap B}(x)\)
3. 互补性:\(I_{A^c}(x)=1-I_A(x)\),其中\(A^c\)\(A\)的补集
4. 积分性质:\(\int I_A(x)dF(x)=P(X\in A)\)
核心应用场景 1. 离散型分布函数的统一表达式书写
2. 复杂事件的概率转化为示性函数的期望计算
3. 截断随机变量、条件期望的表达式简化
4. 统计量、似然函数的构造与推导

表5 Lebesgue-Stieltjes(L-S)积分核心知识点

项目 详细内容
核心定义 对有界可测函数\(g(x)\)和测度\(\mu(\cdot)\),将区间划分为可测集,当划分无限细化时,上和与下和的极限即为L-S积分,记为:
$$\int_a^b g(x)d\mu(x) = \int_a^b g(x)\mu(dx)$$
核心价值 将离散型的求和运算与连续型的黎曼积分运算统一在同一个数学框架下,无需区分离散/连续型分布,即可完成概率、期望的推导与计算,是数理统计理论推导的核心工具
两大核心测度与对应形式 1. 勒贝格测度:测度值为区间长度,对应连续型分布
积分退化为黎曼积分:\(\int_a^b g(x)d\mu(x)=\int_a^b g(x)dx\)
2. 计数测度:测度值为集合包含的点的个数,对应离散型分布
积分退化为求和:\(\int_a^b g(x)d\mu(x)=\sum_{x_k\in[a,b]}g(x_k)\)
拓展性 可直接推广到\(n\)维空间,对应多维随机变量的联合分布、联合期望的计算,逻辑与一维完全一致

表6 概率与数字特征的L-S积分统一表达式

计算对象 离散型专属形式 连续型专属形式 L-S积分统一形式(全类型通用) 核心说明
分布函数\(F(x)\) \(F(x)=\sum_{x_k\leq x}p_k\) \(F(x)=\int_{-\infty}^x f(y)dy\) \(F(x)=\int_{-\infty}^x dF(y)\) 对离散、连续、混合型分布均成立
事件概率\(P(X\in A)\) \(P(X\in A)=\sum_{x_k\in A}p_k\) \(P(X\in A)=\int_A f(y)dy\) \(P(X\in A)=\int_A dF(x)=\int I_A(x)dF(x)\) 概率的本质是示性函数的数学期望
随机变量函数的期望\(\mathbb{E}[\phi(X)]\) \(\mathbb{E}[\phi(X)]=\sum_{k}\phi(x_k)p_k\) \(\mathbb{E}[\phi(X)]=\int_{-\infty}^{+\infty}\phi(x)f(x)dx\) \(\mathbb{E}[\phi(X)]=\int \phi(x)dF(x)\) 无需区分离散/连续,直接用统一式推导统计量的矩、方差等数字特征
方差\(\text{Var}(X)\) \(\text{Var}(X)=\sum_{k}(x_k-\mathbb{E}[X])^2p_k\) \(\text{Var}(X)=\int_{-\infty}^{+\infty}(x-\mathbb{E}[X])^2f(x)dx\) \(\text{Var}(X)=\int (x-\mathbb{E}[X])^2dF(x)\) 方差是特殊的期望,完全适用统一框架

posted on 2026-02-19 17:18  Indian_Mysore  阅读(2)  评论(0)    收藏  举报

导航