【深度学习数学基础:概率论与数理统计】1.1.7 事件域
1. 随机事件与概率
1.1 随机事件及其运算
1.1.7 事件域
在此我们要给出的“事件域”概念,目的是为下一节定义事件的概率作准备。
事件域的直观理解
所谓的“事件域”从直观上讲,是样本空间中某些子集及其运算(并、交、差、对立)结果组成的集合类,记为\(\mathscr{F}\)。这里的“某些子集”可根据样本空间的性质调整:
- 对离散样本空间(如有限个样本点),可用所有子集构成事件域;
- 对连续样本空间(如实数区间),需避免“不可测集”(无法定义长度/概率的子集),仅将“可测集”(能定义概率的子集)纳入事件域。
事件域的核心要求
我们需要\(\mathscr{F}\)对集合运算(并、交、差、对立)封闭(即运算结果仍在\(\mathscr{F}\)中)。通过研究发现:
- 交运算可由“并+对立”实现(德摩根公式:\(\bigcap\limits_{n=1}^{\infty} A_n = \overline{\bigcup\limits_{n=1}^{\infty} \overline{A_n}}\));
- 差运算可由“对立+交”实现(\(A - B = A \cap \overline{B}\))。
因此,并与对立是最基本的封闭运算,由此可严格定义事件域(σ域/σ代数)。
定义1.1.1(事件域/σ域/σ代数)
设\(\Omega\)为样本空间,\(\mathscr{F}\)是\(\Omega\)的某些子集组成的集合类。若\(\mathscr{F}\)满足:
- \(\Omega \in \mathscr{F}\)(包含样本空间本身);
- 若\(A \in \mathscr{F}\),则对立事件\(\overline{A} \in \mathscr{F}\)(对立运算封闭);
- 若\(A_n \in \mathscr{F}\ (n=1,2,\cdots)\),则可列并\(\bigcup_{n=1}^{\infty} A_n \in \mathscr{F}\)(可数个集合的并运算封闭)。
则称\(\mathscr{F}\)为事件域(又称\(\sigma\)域或\(\sigma\)代数)。
【注】
- “可列并”指可数个集合的并集(如有限个、与自然数一一对应的无限个集合的并);
- 条件1-3确保了:空集\(\varnothing = \overline{\Omega} \in \mathscr{F}\)(由条件1、2推导),有限并/交、差运算也封闭(可通过“可列并+对立”进一步推导)。
概率与可测空间
在概率论中,称\((\Omega, \mathscr{F})\)为可测空间——只有在可测空间上,才能定义“概率”(下一节内容)。此时\(\mathscr{F}\)中的子集都是“有概率可言的事件”。
例1.1.10 常见事件域的构造
(1)有限样本空间(2个样本点)
若\(\Omega = \{\omega_1, \omega_2\}\),记\(A = \{\omega_1\}\)(则\(\overline{A} = \{\omega_2\}\)),则事件域为:
(2)有限样本空间(\(n\)个样本点)
若\(\Omega = \{\omega_1, \omega_2, \cdots, \omega_n\}\),则事件域\(\mathscr{F}\)包含:
- 空集\(\varnothing\);
- 所有单元素集(共\(n\)个)、双元素集(共\(\binom{n}{2}\)个)、…、\(n\)元素集(即\(\Omega\))。
此时\(\mathscr{F}\)中事件总数为:
【注】
这是二项式定理的直接结果:\((1+1)^n = \sum_{k=0}^n \binom{n}{k} = 2^n\),本质是“\(n\)个元素的子集总数为\(2^n\)”(每个元素可选或不选,共\(2 \times 2 \times \cdots \times 2 = 2^n\)种组合)。
(3)可列样本空间(无限可数个样本点)
若\(\Omega = \{\omega_1, \omega_2, \cdots, \omega_n, \cdots\}\)(如自然数集),则事件域\(\mathscr{F}\)包含:
- 空集\(\varnothing\);
- 所有“可列个单元素集”“可列个双元素集”…“可列个\(n\)元素集”…以及\(\Omega\)。
此时\(\mathscr{F}\)由可列个可列集(仍为可列个)组成,满足σ域的封闭性。
(4)连续样本空间(实数集\(\mathbb{R} = (-\infty, \infty)\))
实数集的子集可能包含“不可测集”(无法定义长度/概率),因此需构造博雷尔(Borel)事件域:
-
基础:半直线类
先定义“全体半直线组成的类”:\[\mathscr{P} = \{(-\infty, x) \mid -\infty < x < \infty\} \] -
扩展有限区间
利用σ域的封闭性,扩展出左闭右开区间:\[[a, b) = (-\infty, b) - (-\infty, a) \quad (a, b \text{ 为实数}) \] -
扩展其他区间与单点集
通过可列并、交、对立,进一步扩展出:- 闭区间:\(\displaystyle [a, b] = \bigcap_{n=1}^{\infty} \left[a, b + \frac{1}{n}\right)\)(可列个左闭右开区间的交);
- 单点集:\(\{b\} = [a, b] - [a, b)\)(闭区间减左闭右开区间);
- 左开右闭区间:\((a, b] = [a, b] - \{a\}\);
- 开区间:\((a, b) = [a, b) - \{a\}\)。
-
扩展所有可测集
最后,用“有限或可列个并、交运算”,扩展出实数集中的有限集、可列集、开集、闭集等,最终得到的集合类就是博雷尔事件域,记为\(\mathscr{B}(\mathbb{R})\)。
【注】
博雷尔事件域中的子集称为博雷尔集(或“可测集”),是实数集上“可定义概率”的事件。通过限制在博雷尔集内,规避了“不可测集无法定义长度/概率”的问题,是连续样本空间中定义概率的基础。
定义1.1.2(样本空间的分割)
对样本空间\(\Omega\),若有\(n\)个事件\(D_1, D_2, \cdots, D_n\)满足:
- 互不相容:\(D_i \cap D_j = \varnothing\ (i \neq j)\);
- 完全覆盖:\(\displaystyle \bigcup_{i=1}^n D_i = \Omega\)。
则称\(D_1, D_2, \cdots, D_n\)为\(\Omega\)的一组分割(也可推广到可列个事件的分割)。
分割的作用:简化事件域
分割常用于简化概率问题(如全概率公式)。例如:
案例:电视机彩色浓度的分割
设彩色浓度\(x\)的目标值为\(m\),按“与\(m\)的偏差”将样本空间\(\Omega = (-\infty, \infty)\)分割为4个事件:
- \(D_1 = \{|x - m| \leq a\}\)(一等品);
- \(D_2 = \{a < |x - m| \leq 2a\}\)(二等品);
- \(D_3 = \{2a < |x - m| \leq 3a\}\)(三等品);
- \(D_4 = \{|x - m| > 3a\}\)(不合格品)。
此时分割\(\mathscr{D} = \{D_1, D_2, D_3, D_4\}\)将\(\Omega\)划分为互不相容的4个事件。研究时只需关注由\(\mathscr{D}\)生成的事件域\(\sigma(\mathscr{D})\)——它由\(\mathscr{D}\)中事件的所有可能并集(含空集)组成,共\(2^4 = 16\)个事件,大幅简化了问题。
一般分割的事件域大小
若分割\(\mathscr{D}\)由\(n\)个事件组成,则其生成的事件域\(\sigma(\mathscr{D})\)包含\(2^n\)个事件(每个事件可看作分割中事件的“子集选择”:选或不选每个\(D_i\),再取并集)。
【注】
若分割\(\mathscr{D}\)包含\(n\)个事件,则其生成的事件域\(\sigma(\mathscr{D})\)共有\(2^n\)个事件。原理是:每个\(D_i\)有“选”或“不选”两种可能,所有选择的“并集组合”对应\(\sigma(\mathscr{D})\)的事件(含空集,即全不选的情况)。
浙公网安备 33010602011771号